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Beschreibuna 

Gegenstand der Erfindung ist ein Verfahren zurfermentativen Herstellung von schwefelhaltigen 
Feinchemikalien, insbesondere L-Methionin, unter Verwendung von Bakterien, in denen einefur 
ein Homoserin-O-Acetyl-Transferase (metA)-Gen kodierende Nukteotidsequenzen exprimiert 
wird. 

Stand der Technik 

Schwefelhaltige Feinchemikalien, wie zum Beispiel Methionin, Homocystein, S-Adenosyl- 
Methionin, Giutathion, Cystein, Biotin, Thiamin, Liponsaure werden Qber natQrliche Stoffwech- 
selprozesse in Zellen hergestellt und werden in vielen Industriezweigen verwendet, einschliefi- 
lich der Nahrungsmittel-, Futtermittel- Kosmetik- und pharmazeutischen Industrie. Diese Sub- 
stanzen, die zusammen als "schwefelhaltige Feinchemikalien" bezeichnet werden, umfassen 
organische Sauren, sowohl proteinogene als auch nicht-proteinogene Aminosauren, Vitamine 
und Cofaktoren. Ihre Produktion erfolgt am zweckmaliigsten im Grofimalistab mittels Anzucht 
von Bakterien, die entwickelt wurden, urn grolie Mengen der jeweils gewQnschten Substanzzu 
produzieren und sezernieren. Fur diesen Zweck besonders geeignete Organismen sind coryne- 
forme Bakterien, gram-positive nicht-pathogene Bakterien. 

Es ist bekannt, dass Aminosauren durch Fermentation von Stammen coryneformer Bakterien, 
insbesondere Corynebacterium glutamicum, hergestellt werden. Wegen dergroBen Bedeutung 
wird standig an der Verbesserung der Herstellverfahren gearbeitet. Verfahrensverbesserungen 
konnen fermentationstechnische Maftnahmen, wie zum Beispiel RQhrung und Versorgung mit 
Sauerstoff, oder die Zusammensetzung der Nahrmedien, wie zum Beispiel die Zuckerkonzentra- 
tion wahrend der Fermentation, oder die Aufarbeitung zum Produkt , beispielsweise durch lone- 
naustauschchromatographie, oder die intrinsischen Leistungseigenschaften des Mikroorganis- 
mus seibst betreffen. 

Ober Stammselektion sind eine Reihe von Mutantenstammen entwickeltworden, die ein Sorti- 
ment wunschenswerter Verbindungen aus der Reihe der schwefelhaltigen Feinchemikalien pro- 
duzieren. Zur Verbesserung der Leistungseigenschaften dieser Mikroorganismen hinsichtlich der 
Produktion eines bestimmten MoiekQIs werden Methoden der Mutagenese, Selektion und Mut- 
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antenauswahl angewendet. Dies ist jedoch ein zeitaufwendiges und schwieriges Verfahren. Auf 
diese Weise erhalt man z.B. Stamme, die resistent gegen Antimetabolite, wie z. B. die Methio- 
nin-Analoga a-Methyl-Methionin, Ethionin, Norleucin, N-Acetylnorleucin, S- 
Trifluoromethylhomocystein, 2-Amino-5-heprenoitsaure, Seleno-Methionin, Methioninsulfoximin, 
5 Methoxin, 1-Aminocyclopentan-Carboxylsaure oder auxotroph fQr regulatorisch bedeutsame 
Metabolite sind und schwefelhaltige Feinchemikalien, wie z. B. L-Methionin, produzieren. 
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Seit einigen Jahren werden ebenfalls Methoden der rekombinanten DNA-Technik zur Stamm- 
verbesserung von L-Aminosaure produzierender Stamme von Corynebacterium eingesetzt, in- 
1 0 dem man einzelne Aminosaure-Biosynthesegene ampliflziert und die Auswirkung auf die Amino- 
saure-Produktion untersucht. 

Kurze Beschreibung der Erfindunq 



1 5 Der Erfindung lag die Aufgabe zugrunde, ein neues Verfahren zur verbesserten fermentativen 
Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, bereitzustellen. 

Gelost wird obige Aufgabe durch Bereitstellung eines Verfahrens zur fermentativen Herstellung 
einerschwefelhaltigen Feinchemikalie, umfassend die Expression einer heterologen Nukleotid- 
20 sequenz, welche fQr ein Protein mit metA-Aktivitat kodiert, in einem coryneformen Bakterium. 

Ein erster Gegenstand der Erfindung ist Verfahren zur fermentativen Herstellung wenigstens 




einer schwefelhaltigen Feinchemikalie, welches folgende Schritte umfasst: 

a) Fermentation einer die gewOnschte schwefelhaltige Feinchemikalie produzierenden co- 



25 ryneformen Bakterienkultur, wobei in den coryneformen Bakterien zumindest eine hetero- 

loge Nukleotidsequenz exprimiert wird, welche fOr ein Protein mit Homoserin-O-Acetyl- 
Transferase (metA) -Aktivitat kodiert; 
b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den Zellen der 
Bakterien, und 

30 c) Isolieren der schwefelhaltigen Feinchemikalie, welche vorzugsweise L-Methionin um- 
fasst. 
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Vorzugsweise besitzt obige heterologe metA-kodierende Nukleotidsequenz zur metA- 
kodierenden Sequenz aus Corynebacterium glutamicum ATCC 13032 eine Sequenzhomologie- 
von wenigerals 100% und vorzugsweise von mehrals 70% aufweist. Die metA-kodierende Se- 
quenz ist vorzugsweise aus einem der folgenden Organismen von Liste I abgeleitet: 



Liste I 



Corynebacterium diphteriae 


ATCC 14779 


Mycobacterium leprae 


ATCC 43910 


Mycobacterium tuberculosis CDC1551 


ATCC 25584 


Chlorobium tepidum 


ATCC 49652 


Pseudomonas aeruginosa 


ATCC 17933 


Caulobacter crescentus 


ATCC 19089 


Neisseria gonorrhoeae 


ATCC 53420 


Neisseria meningitidis 


ATCC 53414 


Pseudomonas fluorescens 


ATCC 13525 


Burkhoideria cepacia 


ATCC 25416 


Nitrosomonas europaea 


ATCC 19718 


Haemophilus influenzae 


ATCC 51907 _J 


Halobacterium sp NRC1 


ATCC 33170 


Thermus thermophilus 


ATCC 27634 


Deinococcus radiodurans 


ATCC 13939 


Saccharomyces cerevisiae 


ATCC 10751 


Schizosaccharomyces pombe 


ATCC 24969 


Xylella fastidiosa 


ATCC 35881 


Emericella nidulans 


ATCC 36104 


Mesorhizobium loti 


ATCC 35173 


Acremonium crysogenum 


ATCC 11550 


Pseudomonas putida 


ATCC 47054 


Staphylococcus aureus 


ATCC 35556 



ATCC: American Type Culture Collection, Rockville, MD, USA 



Die erfindungsgemail eingesetzte metA-kodierende Sequenz umfasst vorzugsweise eine kodie- 
rende Sequenz gemali SEQ ID NO:1 , 3, 5, 7, 9. 1 1 , 1 3, 1 5, 1 7, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 
37, 39, 41 , 43 und 45 oder eine dazu homologe Nukleotidsequenz, welche fur ein Protein mit 
metA-Aktivitat kodiert, umfasst 

Die erfindungsgemaft eingesetzte metA-kodierende Sequenz kodiert aufierdem vorzugsweise 
fur ein Protein mit metA-Aktivitat, wobei das Protein eine Aminosauresequenz gemaft SEQ ID 
NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 und 46 oder 
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eine dazu homologe Aminosauresequenz, welche fOr ein Protein mit metA-Aktivitat steht, urn- 
fasst 

Die kodierende metA-Sequenz ist vorzugsweise eine in coryneformen Bakterien replizierbare 
5 oder eine stabil in das Chromosom intregrierte DNA oder eine RNA. 

Gemafi einer bevorzugten Ausfuhrungsform wird das erfindungsgemalJe Verfahren durchge- 
fuhrt, indem man 

10 a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetztderwenigstens 
eine Kopie der kodierenden metA-Sequenz unter der Kontrolle regulativer Sequenzen tragt, oder 
b) einen Stamm einsetzt, in dem die kodierende metA-Sequenz in das Chromosom des 
Bakteriums integriert wurde 

1 5 Es ist weiterhin bevorzugt, die kodierende metA-Sequenz fur die Fermentation zu uberexprimie- 
ren. 

Aulierdem kann es wunschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges dergewunschten schwefelhaltigen Feinchemikalie 
20 verstarkt ist; und / oder 

in denen wenigstens ein Stoffwechseiweg zumindestteilweise ausgeschaltet sind, der die Bil- 
dung der gewunschten schwefelhaltigen Feinchemikalie verringert. 

^ Aufierdem kann es wunschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
25 tens ein weiteres Gen des Biosyntheseweges der gewQnschten schwefelhaltigen Feinchemikalie 
durch Stoffwechselmetabolite in seiner Aktivitat nicht in unerwunschter Weise beeinflusst wird. 

Gemali einer weiteren AusfOhrungsform des erfindungsgemafien Verfahrens werden deshalb 
coryneforme Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt 
30 unter 

a) dem fQr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fdr eine Aspartat-Semialdehyd-Dehydrogenase kodierenden Gen asd 
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c) dem fur die Giycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

d) dem fur die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

e) dem fOr die Pyruvat Carboxylase kodierenden Gen pyc, 

f) dem fur die Triosephosphat Isomerase kodierenden Gen tpi, 

g) dem fur die Methionin Synthase kodierenden Gen metH, 

h) dem fur die Cystahionin-gamma-Synthase kodierenden Gen metB, 

i) dem fur die Cystahionin-gamma-Lyase kodierenden Gen metC, 

j) dem fur die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 
k) dem fur die O-Acetylhomoserin-Sulfhydrylase kodierenden Gen metY, 
I) dem fur die Methylen-Tetrahydrofolat-Reduktase kodieren Gen, metF 
m) dem fur die Phosphoserin-Aminotransferase kodieren Gen serC 
n) dem fur die Phosphoserin-Phosphatase kodieren Gen serB, 
o) dem fur die Serine Acetyl-Transferase kodieren Gen cysE, 
p) dem fOr die Homoserin-Dehydrogenase kodieren Gen horn, 
uberexprimiert ist. 

Gemaft einer anderen AusfOhrungsform des erfindungsgemalien Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene ausgewahlt unter 
Genen der oben genannten Gruppe a) bis p) mutiert ist, so dass die korrespondierenden Protei- 
ne, verglichen mit nicht mutierten Proteinen, in geringerem Mafte Oder nicht durch Stoffwech- 
selmetabolite in ihrer Aktivitat beeinflusst werden und dass insbesondere die erfindungsgemalie 
Produktion der Feinchemikalie nicht beeintrachtigt wird. 

GemalJ einer anderen AusfOhrungsform des erfindungsgemalien Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 
q) dem fur die Homoserine-Kinase kodierenden Gen thrB, 
r) dem fur die Threonin Dehydratase kodierenden Gen ilvA, 
s) dem fur die Threonin Synthase kodierenden Gen thrC 
t) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 
u) dem fOr die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 
v) dem fur die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 
w) dem fur die Pyruvat-Oxidase kodierenden Gen poxB, 
x) dem fur die Dihydrodipicolinat Synthase kodiernden Gen dapA, 
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y) dem fur die Dihydrodipicolinat Reduktase kodiernden Gen dapB; Oder 
z) dem fur die Diaminopicolinat Decarboxylase kodiernden Gen lysA 
abschwacht ist, insbesondere durch Verringerung der Expressionsrate des korrespondierenden 
Gens. 

Gemafi einer anderen Ausftihrungsform des erfindungsgemalJen Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene der obigen Gruppen 
q) bis z) mutiert ist, so dass die enzymatische Aktivitat des korrespondierenden Proteins teilwei- 
se oder vollstandig verringert wird. 

Vorzugsweise werden in dem erfindungsgemalJen Verfahren Mikroorganismen der Art Coryne- 
bacterium glutamicum eingesetzt. 

Ein weiterer Gegenstand der Erfindung betrifft ein Verfahren zur Herstellung eines L-Methionin- 
1 5 haltigen Tierfuttermittel-Additivs aus Fermentationsbruhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden Mikroorganis- 
mus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen FermentationsbrQhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
20 von 0 bis 100 Gew.-%; und 

d) Trocknung der gemaft b) und/oder c) erhaltenen FermentationsbrQhe, urn das 
Tierfuttermittel-Additiv in der gewunschten Pulver- oder Granulatform zu erhalten. 

Gegenstand der Erfindung sind ebenfalls die erstmalig aus obigen Mikroorganismen isolierten 
25 kodierenden metA-Sequenzen, die davon kodierten Homoserin-O-Acetyl-Transferase sowie die 
funktionalen Homologen dieser Polynukleotide bzw. Proteine. 

Detaillierte Beschreibuna der Erfindung 

30 a) Allgemeine Begriffe 

Als Proteine mit der Aktivitat der Homoserin-O-Acetyl-Transferase auch metA (EC 2.3.1 .31 ) ge- 
nannt, werden solche Proteine beschrieben, die in der Lage sind Homoserin und Acetyl-Co- 
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EnzymA zu O-Acetyl-Homoserin umzusetzen. Der Fachmann unterscheidet die Aktivivat der 
Homoserin-O-Acetyl-Transferase von der Homoserin-O-Succinyl-Transferase, die in derLiteratur 
aber auch metA genannt wird. In dem letztgenannten Enzym dient Succinyl-Coenzym A und 
nicht Acetyl- Coenzym A als Substrat der Reaktion. Der Fachmann kann die enzymatische Akti- 
vivtat von Homoserin-O-Acetyl-Transferase durch Enzymtests nachweisen, Vorschriften dafiir 
konnen sein: Park SD. Lee JY. Kim Y. Kim JH. Lee HS. Molecules & Cells. 8(3):286-94, 1998. 

Im Rahmen der vorliegenden Erfindung umfasstder Begriff ..schwefelhaltige Feinchemikalie" 
jegliche chemische Verbindung, die wenigstens ein Schwefelatom kovalent gebunden enthalt 
und durch ein erfindungsgemaftes Fermentationsverfahrens zuganglich ist. Nichtlimitierende 
Beispiele dafOr sind Methionin, Homocystein, S-Adenosyl-Methionin, insbesondere Methio- 
nin.und S-Adenosyl-Methionin. 

Im Rahmen der vorliegenden Erfindung umfassen die Begriffe ,,L-Methionin", „Methionin", Ho- 
mocystein und S-Adenosylmethionin auch die korrespondierenden Salze, wie z. B. Methionin- 
Hydrochlorid oder Methionin-Sulfat 

"Polynukleotide" bezeichnet im allgemeinen Polyribonukleotide (RNA) und Polydeoxyribonukleo- 
tide (DNA), wobei es sich urn nicht modifizierte RNA oder DNA oder modifizierte RNA oder DNA 
handeln kann. 

Unter "Polypeptides versteht man erfindungsgem§li Peptide oder Proteine, die zwei oder mehr 
Ober Peptidbindungen verbundene Aminosauren enthalten. 

Der Begriff „Stoffwechselmetabolit" bezeichnet chemische Verbindungen, die im Stoffwechsel 
von Organismen als Zwischen- oder auch Endprodukte vorkommen und die neben ihrer Eigen- 
schaft als chemische Bausteine auch modulierende Wirkung auf Enzyme und ihre katalytische 
Aktivitat haben konnen. Dabei ist aus der Literatur bekannt, dass solche Stoffwechselmetabolite 
sowohl hemmend als auch stimulierend auf die Aktvitat von Enzymen wirken konnen (Bioche- 
mistry, Stryer, Lubert, 1 995 W. H. Freeman & Company, New York, New York.). In der Literatur 
ist auch beschrieben, dass es moglich ist durch Maftnahmen wie Mutation der genomischen 
DNA durch UV-Strahlung, ionisierender Strahlung oder mutagene Substanzen und nachfolgen- 
der Selektion auf bestimmte Phanotypen in Organismen solche Enzyme zu produzieren, in de- 
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nen die Beeinflussung durch Stoffwechselmetabolite verandert wurde (Sahm H. Eggeling L. de 
Graaf AA. Biological Chemistry 381 (9-10):899-910, 2000; Eikmanns BJ. Eggeling L. Sahm H. 
Antonie van Leeuwenhoek. 64:145-63, 1993-94). Diese veranderten Eigenschaften konnen auch 
durch gezielte Malinahmen erreichtwerden. Dabei istdem Fachmann bekannt, dass in GenefOr 
5 Enzyme auch gezielt bestimmte Nukleotide der fOr das Protein kodierenden DNA so zu veran- 
dern, dass das aus der exprimierten DNA-Sequenz resultierende Protein bestimmte neue Ei- 
genschaften aufweist, so zum Beispiel, dass die modulierende Wirkung von Stoffwechselmeta- 
boliten gegenuber dem nicht veranderten Protein verandert ist 

Die Begriffe"exprimieren" bzw. "Verstarkung"oder„Oberexpression" beschreiben im Kontextder 
Erfindung die Produktion bzw. Erhflhung der intrazellularen Aktivitat eines odermehrerer Enzy- 
me in einem Mikroorganismus, die durch die entsprechende DNA kodiert werden. Dazu kann 
man beispielsweise ein Gen in einen Organismus einbringen, ein vorhandenes Gen durch ein 
anderes Gen ersetzen, die Kopienzahl des Gens bzw. der Gene erhohen, einen starken Promo- 
tor verwenden oder ein Gen verwenden, das fur ein entsprechendes Enzym mit einer hohen 
Aktivitat kodiert und man kann gegebenenfalls diese Malinahmen kombinieren. 

b) Erfindungsgemade metA-Proteine 

20 Erfindungsgemad mit umfasst sind ebenfalls „funktionale Aquivalente" der konkret offenbarten 
metA-Enzyme aus Organismen obiger Liste I. 

MM „Funktionale Aquivalente" oder Analoga der konkret offenbarten Polypeptide sind im Rahmen 
der vorliegenden Erfindung davon verschiedene Polypeptide, welche weiterhin die gewunschte 
25 biologische Aktivitat, wie z.B. Substratspezifitat, besitzen. 

Unter "funktionalen Aquivalenten" versteht man erfindungsgemali insbesondere Mutanten, wel- 
che in wenigstens einer der oben genannten Sequenzpositionen eine andere als die konkret 
genannte Aminosaure aufweisen aber trotzdem eine der oben genannten biologische Aktivitat 
30 besitzen. "Funktionale Aquivalente" umfassen somit die durch eine oder mehrere Aminosaure- 
Additionen, -Substitutionen, -Deletionen und/oder-lnversionen erhaltlichen Mutanten, wobei die 
genannten Veranderungen in jeglicher Sequenzposition auftreten konnen, solange sie zu einer 
Mutante mit dem erfindungsgemaden Eigenschaftsprofil fuhren. Funktionale Aquivalenz ist ins- 
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besondere auch dann gegeben, wenn die Reaktivitatsmuster zwischen Mutante und unverander- 
tem Polypeptid qualitativ ubereinstimmen, d.h. beispielsweise gleiche Substrate mit unterschied- 
licher Geschwindigkeit umgesetzt werden. 

5 "Funktionale Aquivalente" umfassen naturlich auch Polypeptide welche aus anderen Organis- 
men zuganglich sind, sowie naturlich vorkommende Varianten. Beispielsweise lassen sich durch 
Sequenzvergleich Bereiche homologer Sequenzregionen festlegen und in Anlehnung an die 
konkreten Vorgaben der Erfindung aquivalente Enzyme ermitteln. 

1 0 „Funktionale Aquivalente" umfassen ebenfalls Fragmente, vorzugsweise einzelne Domanen o- 

• derSequenzmotive, der erfindungsgemalien Polypeptide, welche z.B. die gewunschte biologi- 
sche Funktion aufweisen. 

„Funktionale Aquivalente" sind auderdem Fusionsproteine, welche ein der oben genannten Po- 
1 5 lypeptidsequenzen oder davon abgeleitete funktionale Aquivalente und wenigstens eine weitere, 
davon funktionell verschiedene, heterologe Sequenz in funktioneller N- oder C-terminaler Ver- 
knupfung (d.h. ohne gegenseitigen wesentliche funktionelle Beeintrachtigung der Fusionsprote- 
inteile) aufweisen. Nichtlimitiemde Beispiele fOr derartige heterologe Sequenzen sind z.B. Sig- 
nalpeptide, Enzyme, Immunoglobuline, Oberflachenantigene, Rezeptoren oder Rezeptorligan- 
20 den. 

ErfindungsgemaR mit umfasste „funktionale Aquivalente" sind Homologe zu den konkret offen- 

• barten Proteinen. Diese besitzen wenigstens 20%, oder etwa 30%, 40%, 50 %, vorzugsweise 
wenigstens etwa 60 %, 65%, 70%, oder 75% ins besondere wenigsten 85 %, wie z.B. 90%, 95% 
25 Oder 99%, Homologie zu einer der konkret offenbarten Sequenzen, berechnet nach dem Algo- 
rithmus von Pearson und Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2444-2448. 

Homologe der erfindungsgemafJen Proteine oder Polypeptide konnen durch Mutagenese er- 
zeugt werden, z.B. durch Punktmutation oderVerkOrzung des Proteins. Der Begriff "Homolog", 
30 wie er hier verwendet wird, betrifft eine variante Form des Proteins, die als Agonist o- 
der Antagonist der Protein-Aktivitat wirkt. 
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Homologe des erfindungsgemafien Proteine konnen durch Screening kombinatorischer Banken 
von Mutanten, wie z.B. VerkGrzungsmutanten, identifiziert werden. Beispielsweise kann eine 
variegierte Bank von Protein-Varianten durch kombinatorische Mutagenese auf Nukleinsaure- 
ebene erzeugt werden, wie z.B. durch enzymatisches Ligieren eines Gemisches synthetischer 
Oligonukleotide. Es gibt eine Vielzahl von Verfahren, die zur Herstellung von Banken potentieller 
Homologer aus einer degenerierten Oligonukleotidsequenz verwendet werden konnen. Die 
chemische Synthese einer degenerierten Gensequeriz kann in einem DNA-Syntheseautomaten 
durchgefflhrt werden, und das synthetische Gen kann dann in einen geeigneten 
Expressionsvektor ligiert werden. Die Verwendung eines degenerierten Gensatzes ermoglicht 
die Bereitstellung samtlicher Sequenzen in einem Gemisch, die den gewOnschten Satz an 
potentiellen Proteinsequenzen codieren. Verfahren zur Synthese degenerierter Oligonukleotide 
sind dem Fachmann bekannt (Z.B. Narang, S.A. (1983) Tetrahedron 39:3; Itakura et al. (1984) 
Annu. Rev. Biochem. 53:323; Itakura et al., (1984) Science 198:1056; Ike etal. (1983) Nucleic 
Acids Res. 11:477). 

Zusatzlich konnen Banken von Fragmenten des Protein-Codons verwendet werden, um eine 
variegierte Population von Protein-Fragmenten zum Screening und zur anschlielienden Selekti- 
on von Homologen eines erfindungsgemafien Proteins zu erzeugen. Bei einer Ausfuhrungsform 
kann eine Bank von kodierenden Sequenzfragmenten durch Behandeln eines doppelstrangigen 
PCR-Fragmentes einer kodierenden Sequenzmit einer Nuklease unter Bedingungen, unter de- 
nen ein Nicking nur etwa einmal pro Molekul erfolgt, Denaturieren der doppelstrangigen DNA, 
Renaturieren der DNA unter Bildung doppelstrangiger DNA, die Sense-/Antisense-Paare von 
verschiedenen genickten Produkten umfassen kann, Entfernen einzelstrangiger Abschnitte aus 
neu gebildeten Duplices durch Behandlung mit S1-Nuclease und Ligieren der resultierenden 
Fragmentbank in einen Expressionsvektor erzeugt werden. Durch dieses Verfahren kann eine 
Expressionsbank hergeleitet werden, die N-terminale, C-terminale und interne Fragmente mit 
verschiedenen GrofJen des erfidungsgemalSen Proteins kodiert. 

Im Stand der Technik sind mehrere Techniken zum Screening von Genprodukten kombinatori- 
scher Banken, die durch Punktmutationen oder VerkUrzung hergestellt worden sind, und zum 
Screening von DNA-Banken auf Genprodukte mit einer ausgewahlten Eigenschaft bekannt. Die- 
se Techniken lassen sich an das schnelle Screening der Genbanken anpassen, die durch kom- 
binatorische Mutagenese von erfindungsgemafier Homologer erzeugt worden sind. Die am hau- 
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figsten verwendeten Techniken zum Screening grofter Genbanken, die einer Analyse mit hohem 
Durchsatz unterliegen, umfassen das Klonieren der Genbank in replizierbare Expressionsvekto- 
ren, Transformieren der geeigneten Zellen mit der resultierenden Vektorenbank und Exprimieren 
der kombinatorischen Gene unter Bedingungen, unter denen der Nachweis der gewQnschten 
Aktivitat die Isolation des Vektors, der das Gen codiert, dessen Produkt nachgewiesen wurde, 
erleichtert. Recursive-Ensemble-Mutagenese (REM), eineTechnik, die die Haufigkeitfunktionel- 
ler Mutanten in den Banken vergroliert, kann in Kombination mit den Screeningtests verwendet 
werden, urn Homologe zu identifizieren (Arkin und Yourvan (1992) PNAS 89:781 1-7815; Delgra- 
ve et al. (1993) Protein Engineering 6(3):327-331 

c) Erfindunasgemafie Polvnukleotide 

Gegenstand der Erfindung sind ebenso Nukleinsauresequenzen (einzel- und doppelstrangige 
DNA- und RNA-Sequenzen, wie z.B. cDNA und mRNA), kodierend for eines der obigen metA- 
Enzyme und deren funktionalen Aquivalenten, welche z.B. auch unter Verwendung kunstlicher 
Nukleotidanaloga zuganglich sind. 

Die Erfindung betrifft sowohl isolierte NukleinsauremolekQIe, welche fur erfindungsgemafce Po- 
lypeptide bzw. Proteine oder biologisch aktive Abschnitte davon kodieren, sowie Nukleinsaure- 
fragmente, die z.B. zur Verwendung als Hybridisierungssonden oder Primer zur Identifizierung 
oder Amplifizierung von erfindungsgemafJerkodierenden Nukleinsauren verwendet werden k5n- 
nen. 

Die erfindungsgemaden NukleinsauremolekQIe konnen zudem untranslatierte Sequenzen vom 
3'- und/oder 5'-Ende des kodierenden Genbereichs enthalten 

Ein "isoliertes" NukleinsauremolekQI wird von anderen Nukleinsauremolekulen abgetrennt, die in 
der natOrlichen Quelle der Nukleinsaure zugegen sind und kann Oberdies im wesentlichen frei 
von anderem zellularen Material oder Kulturmedium sein, wenn es durch rekombinante Techni- 
ken hergestellt wird, oder frei von chemischen Vorstufen oder anderen Chemikalien sein, wenn 
es chemisch synthetisiert wird. 

Die Erfindung umfasst weiterhin die zu den konkret beschriebenen Nukleotidsequenzen kom- 
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plementaren Nukleinsauremolekule oder einen Abschnitt davon. 

Die erfindungsgemafi Nukleotidsequenzen ermoglichen die Erzeugung von Sonden und Pri- 
mern, die zur Identifizierung und/oder Klonierung von homologer Sequenzen in anderen Zellty- 
pen und Organismen verwendbar sind. Solche Sonden bzw. Primer umfassen gewohnlich einen 
Nukleotidsequenzbereich, der unter stringenten Bedingungen an mindestens etwa 12, vorzugs- 
weise mindestens etwa 25, wie z.B. etwa 40, 50 oder 75 aufeinanderfolgende Nukleotide eines 
Sense-Stranges einer erfindungsgemafien Nukleinsauresequenz oder eines entsprechenden 
Antisense-Stranges hybridisiert. 



Weitere erfindungsgemalJe Nukleinsauresequenzen sind abgeleitet von SEQ ID NO:1, 3, 5, 7, 9, 
11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43 oder 45 und unterscheiden sich 
davon durch Addition, Substitution, Insertion oder Deletion einzelner oder mehrerer Nukleotide, 
kodieren aberweiterhin fOr Polypeptide mitdem gewOnschten Eigenschaftsprofil. Dies konnen 
1 5 Polynukleotide sein, die zu obigen Sequenzen in mindestens etwa 50%, 55%, 60%, 65%, 70%, 
80% Oder 90% f vorzugsweise in mindestens etwa 95%, 96%, 97%, 98% oder 99% der Se- 
quenzpositionen identisch sind. 



Erfindungsgemafi umfasst sind auch solche Nukleinsauresequenzen, die sogenannte stumme 
20 Mutationen umfassen oder entsprechend der Codon-Nutzung eins speziellen Ursprungs- oder 
Wirtsorganismus, im Vergleich zu einer konkret genannten Sequenz verandert sind, ebenso wie 
naturlich vorkommende Varianten, wie z.B. Spleifivarianten oder Allelvarianten, davon. Gegens- 

• tand sind ebenso durch konservative Nukleotidsubstutionen (d.h. die betreffende Aminosaure 
wird durch eine Aminosaure gleicher Ladung, Grolie, Polaritat und/oder Loslichkeit ersetzt) er- 
25 haltliche Sequenzen. 

Gegenstand der Erfindung sind auch die durch Sequenzpolymorphismen von den konkret offen- 
barten Nukleinsauren abgeleiteten MolekOIe. Diese genetischen Polymorphismen konnen zwi- 
schen Individuen innerhalb einer Population aufgrund der naturlichen Variation existieren. Diese 
30 naturlichen Variationen bewirken ublicherweise eine Varianz von 1 bis 5 % in der Nukleotidse- 
quenz eines Gens. 

Weiterhin umfasst die Erfindung auch Nukleinsauresequenzen, welchen mit oben genannten 
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kodierenden Sequenzen hybridisieren oderdazu komplementar sind. Diese Polynukleotide las- 
sen sich bei Durchmusterung von genomischen oder cDNA-Banken auffinden und gegebenen- 
falls daraus mit geeigneten Primern mittels PCR vermehren und anschlieftend beispielsweise 
mit geeigneten Sonden isolieren. Eine weitere Moglichkeit bietet die Transformation geeigneter 
Mikroorganismen miterfindungsgemalien Polynukleotiden oderVektoren, die Vermehrung der 
Mikroorganismen und damit der Polynukleotide und deren anschlieftende Isolierung. DarQber 
hinaus konnen erfindungsgemafte Polynukleotide auch auf chemischem Wege synthetisiert 
werden. 

Unter der Eigenschaft, an Polynukleotide „hybridisieren" zu konnen, versteht man die Fahigkeit 
eines Poly- oder Oligonukleotids unter stringenten Bedingungen an eine nahezu komplementare 
Sequenz zu binden, wahrend unter diesen Bedingungen unspezifische Bindungen zwischen 
nicht-komplementaren Partnem unterbleiben. Dazu sollten die Sequenzen zu 70-100%, vor- 
zugsweisezu 90-100%, komplementar sein. Die Eigenschaft komplementarer Sequenzen, spe- 
zifisch aneinander binden zu konnen, macht man sich beispielsweise in der Northern- oder Sou- 
them-Blot-Technik oder bei der Primerbindung in PCR oder RT-PCR zunutze. Oblicherweise 
werden dazu Oligonukleotide ab einer Lange von 30 Basenpaaren eingesetzt. Unter stringenten 
Bedingungen versteht man beispielsweise in der Northern-Blot-Technik die Verwendung einer 
50 - 70 °C, vorzugsweise 60 - 65 °C warmen Waschlosung, beispielsweise 0,1x SSC-Puffer mit 
0,1% SDS (20x SSC: 3M NaCI, 0.3M Na-Citrat, pH 7,0) zur Elution unspezifisch hybridisierter 
cDNA-Sonden oder Oligonukleotide. Dabei bleiben, wie oben erwahnt, nur in hohem Mafte 
komplementare Nukleinsauren aneinander gebunden. Die Einstellung stringenter Bedingungen 
ist dem Fachmann bekannt und ist z:B. in Ausubel et al., Current Protocols in Molecular Biology, 
John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. beschrieben. 

c) Isolierung der kodierenden metA-Gene 

Die for das Enzym Homoserin-O-Acetyl-Transferase codierenden metA-Gene aus den Organis- 
men obiger Liste I sind in an sich bekannter Weise isolierbar. 

Zur Isolierung der metA-Gene oder auch anderer Gene der Organismen aus obiger Liste I wird 
zunachst eine Genbank dieses Organsimus in Escherichia coli (E. coli) angelegt. Das Anlegen 
von Genbanken ist in allgemein bekannten Lehrbuchern und Handbuchern ausfOhrlich beschrie- 
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ben. Als Beispiel seien das Lehrbuch von Winnacker Gene und Klone, Eine EinfQhrung in die 
Gentechnologie (Verlag Chemie, Weinheim, Deutschland, 1990), Oder das Handbuch von 
Sambrook et al.: Molecular Cloning, A Laboratory Manual (Cold Spring Harbor Laboratory Press, 
1989) genannt. Eine sehr bekannte Genbank ist die des E. coli K-12 Stammes W31 10, die von 
5 Kohara et al. (Cell50, 495-508 (198)) in X-Vektoren angelegt wurde. 



Zur Herstellung einer Genbank von Organismen der Liste I in E. coli kfinnen Cosmide, wie der 
CosmidvektorSuperCos I (Wahletal., 1987, Proceedings of the National Academy of Sciences 
USA, 84: 2160-2164), aberauch Plasmide, wie pBR322 (BoliVal; Life Sciences, 25, 807-818 

10 (1979)) Oder pUC9 (Vieira et al., 1 982, Gene, 19: 259-268), verwendet werden. Als Wirte eignen 
M sich besonders solche E. coli Stamme, die restriktions- und rekombinationsdefekt sind. Ein Bei- 

W spiel hierfOr ist der Stamm DH5amcr, der von Grant et al. (Proceedings of the National Academy 
of Sciences USA, 87 (1 990) 4645-4649) beschrieben wurde. Die mit Hilfe von Cosmiden klonier- 
ten langen DNA-Fragmente konnen anschlieliend wiederum in gangige.furdie Sequenzierung 

1 5 geeignete Vektoren subkloniert und anschlieliend sequenziert werden, so wie es z. B. bei San- 
ger et al. (proceedings of the National Academy of Sciences of the United States of America, 74: 
5463-5467, 1977) beschrieben ist. 



Die erhaltenen DNA-Sequenzen kdnnen dann mit bekannten Algorithmen bzw. Sequenzanalyse- 
20 Programmen, wie z. B. dem von Staden (Nucleic Acids Research 14,217-232(1986)), dem von 

Marck (Nucleic Acids Research 16, 1829-1836 (1988)) Oder dem GCG-Programm von Butler 
^ (Methods ofBiochemical Analysis 39, 74-97 (1998)), untersucht werden. 

^ Die fur die metA-Gene kodierenden DNA-Sequenzen von Organismen gemali obiger Liste I 
25 wurde gefunden. Insbesondere wurden DNA-Sequenzen gemali gemali SEQ ID NO:1 , 3, 5, 7, 
9, 11, 13, 15, 17, 19. 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43 und 45. Weiterhin wurde aus 
diesen vorliegenden DNA-Sequenzen mitdenoben beschriebenen Methoden die Aminosaure- 
sequenzen derentsprechenden Proteine abgeleitet. Durch SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 
18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 und 46 sind die sich ergebenden Aminosau- 
30 resequenzen der metA-Genprodukte dargestellt. 

Kodierende DNA-Sequenzen, die sich aus den Sequenzen gemafi SEQ ID NO:1 , 3, 5, 7, 9, 1 1 , 
13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41,43 und 45 durch die Degeneration des 
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genetischen Kodes ergeben, sind ebenfalls Gegenstand der Erfindung. In gleicher Weise sind 
DNA-Sequenzen, die mitdiesen Sequenzen oderdavon abgeleiteten Sequenzteilen hybridisie- 
ren, Gegenstand der Erfindung. 



5 Anleitungen zur Identifizierung von DNA-Sequenzen mittels Hybridisierung findet der Fachmann 
unter anderem im Handbuch 'The DIG System Users Guide fur Filter Hybridization" der Firma 
Boehringer Mannheim GmbH (Mannheim, Deutschland, 1993) und bei Liebl et al. (International 
Journal of Systematic Bacteriology (1 991 ) 41 : 255-260). Anleitungen zur Amplifikation von DNA- 
Sequenzen mit Hilfe der Polymerase-Kettenreaktion (PCR) findet der Fachmann unter anderem 
10 im Handbuch von Gait: Oligonukleotide synthesis: A Practical Approach (IRL Press, Ox- ford, 
UK, 1984) und bei Newton und Graham: PCR (Spektrum Akademischer Verlag, Heidelberg, 
Deutschland, 1994). 



Weiterhin ist bekannt, dass Anderungen am N- und/oder C- Terminus eines Proteins dessen 
1 5 Funktion nicht wesentlich beeintrachtigen oder sogar stabilisieren konnen. Angaben hierzu findet 
der Fachmann unter anderem bei Ben-Bassat et al. (Journal of Bacteriology 169: 751-757 
(1 987)), bei O'Regan et al. (Gene 77: 237-251 (1 989), bei Sahin-Toth et al. (Protein Sciences 3: 
240-247 (1994)), bei Hochuli et al. (Biontechnology 6: 1321-1325 (1988)) und in bekannten 
LehrbQchern der Genetik und Molekularbiologie. 

20 

Aminosauresequenzen, die sich in entsprechender Weise aus den SEQ ID NO:2,4, 6, 8, 10, 12, 
14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 und 46 ergeben, sind ebenfalls Be- 
standteil der Erfindung. 

25 d) Erfindunqsgemaft verwendete Wirtszellen 



Weitere Gegenstande der Erfindung betreffen als Wirtszelle dienende Mikroorgansismen, insbe- 
sondere coryneforme Bakterien, die einen Vektor, insbesondere Pendelvektor oder Plasmidvek- 
tor. der wenigstens ein metA-Gen gerfindungsgemalier Definition tragt, enthalten oder in denen 
30 ein erfindungsgemafces metA-Gen exprimiert bzw. verstarkt ist. 

Diese Mikroorganismen konnen schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
aus Glucose, Saccharose. Lactose, Fructose, Maltose, Melasse, Starke, Cellulose oder aus Gly- 
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cerin und Ethanol herstellen. Vorzugsweise sind dies coryneforme Bakterien, insbesondere der 
Gattung Corynebacterium. Aus der Gattung Corynebacterium ist insbesondere die Art Coryne- 
bacterium glutamicum zu nennen, die in der Fachwelt fOr ihre Fahigkeit bekannt ist, L~ 
Aminosauren zu produzieren. 

Als Beispiele fur geeignete Stamme coryneformer Bakterien sind solche der Gattung 
Corynebacterium, insbesondere der Art Corynebacterium glutamicum (C. glutamicum), wie 
Corynebacterium glutamicum ATCC 13032, 
Corynebacterium acetoglutamicum ATCC 15806, 
Corynebacterium acetoacidophilum ATCC 13870, 
Corynebacterium thermoaminogenes FERM BP-1539, 
Corynebacterium melassecola ATCC 17965 

oder 

1 5 der Gattung Brevibacterium, wie 

Brevibacterium flavum ATCC 14067 

Brevibacterium lactofermentum ATCC 13869 und 

Brevibacterium divaricatum ATCC 14020 zu nennen; 

oder davon abgeleitete Stamme, wie 
20 Corynebacterium glutamicum KFCC10065 

Corynebacterium glutamicum ATCC21608 




welche ebenfalls die gewunschte Feinchemikalie oderderen Vorstufe(n) produzieren. 
Mitder Abkurzung KFCC ist die Korean Federation of Culture Collection gemeint, mitder Abkur- 



25 zung ATCC die American type strain culture collection, mit der Abkurzung FERM BP die Samm- 
lung des National institute of Bioscience and Human-Technology, Agency of Industrial Science 
and Technology, Japan bezeichnet. 

e) Durchfuhrung der erfindunasaemaRen Fermentation 

30 

Erfindungsgemali wurde festgestellt, dass coryneforme Bakterien nach Oberexpression eines 
metA-Gens aus Organismen der Liste I in vorteilhafter Weise schwefelhaltige Feinchemikalien, 
insbesondere L-Methionin, produzieren. 
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Zur Erzielung einer Oberexpression kann der Fachmann unterschiedliche Malinahmen einzeln 
oder in Kombination ergreifen. So kann die Kopienzahl derentsprechenden Gene erhoht wer- 
den, oder es kann die Prornotor- und Regulationsregion oder die Ribosomenbindungsstelle, die 
sich stromaufwarts des Strukturgens befindet, mutiert werden. In gleicherWeise wirken Expres- 
sionskassetten, die stromaufwarts des Strukturgens eingebaut werden. Durch induzierbare Pro- 
motoren ist es zusatzlich moglich, die Expression im Verlaufe der fermentativen L-Methionin- 
Produktion zu steigem. Durch Malinahmen zurVerlangerung derLebensdauerdermRNAwird 
ebenfalls die Expression verbessert Weiterhin wird durch Verhinderung des Abbaus des En- 
zymproteins ebenfalls die Enzymaktivitat verstarkt. Die Gene oder Genkonstrukte konnen ent- 
weder in Plasmiden mit unterschiedlicher Kopienzahl vorliegen oder im Chromosom integriert 
und amplifiziert sein. Alternativ kann weiterhin eine Oberexpression der betreffenden Gene 
durch Veranderung der Medienzusammensetzung und Kulturfuhrung erreicht werden. 

Anleitungen hierzu findet der Fachmann unter anderem bei Martin et al. (Biontechnology 5, 1 37- 
146 (1987)), bei Guerrero et al. (Gene 138, 35-41 (1994)), Tsuchiya und Morinaga 
(Bio/Technology 6, 428-430 (1988)), bei Eikmannset al. (Gene 102, 93-98 (1991)), in derEuro- 
paischen Patentschrift 0472869, im US Patent 4,601 ,893, bei Schwarzer und Puhler (Biotechno- 
logy 9, 84-87 (1991), bei Remscheid etal. (Applied and Environmental Microbiology 60,126-132 
(1994), bei LaBarre et al. (Journal of Bacteriology 1 75, 1001-1007 (1993)), in der Patentanmel- 
dung WO 96/15246, bei Malumbres etal. (Gene 134, 15-24 (1993)), in derjapanischen Offenle- 
gungsschrift JP-A-1 0-229891, bei Jensen und Hammer (Biotechnology and Bioengineering 
58,.191-195 (1998)), bei Makrides (Microbiological Reviews 60 : 512-538 (1996) und in bekann- 
ten LehrbOchern der Genetik und Molekularbiologie. 

Gegenstand der Erfindung sind deshalb auch Expressionskonstrukte, enthaltend unter der ge- 
netischen Kontrolle regulativer Nukleinsauresequenzen eine fur ein erfindungsgemalies Poly- 
peptid kodierende Nukleinsauresequenz; sowie Vektoren, umfassend wenigstens eines dieser 
Expressionskonstrukte. Vorzugsweise umfassen solche erfindungsgemaften Konstrukte 5'- 
stromaufwarts von der jeweiligen kodierenden Sequenz einen Prornotor und 3'-stromabwarts 
eine Terminatorsequenz sowie gegebenenfalls weitere ubliche regulative Elemente, und zwar 
jeweils operativ verknupft mit der kodierenden Sequenz. Unter einer „operativen VerknOpfung" 
versteht man die sequentielle Anordnung von Prornotor, kodierender Sequenz, Terminator und 
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gegebenenfalls weiterer regulativer Elemente derart, dass jedes der regulativen Elemente seine 
Funktion bei der Expression der kodierenden Sequenz bestimmungsgemali erfQIIen kann. Bei- 
spiele furoperativ verkntlpfbare Sequenzen sind Aktivrieungssequenzen sowie Enhancer und 
dergleichen. Weitere regulative Elemente umfassen selektierbare Marker, Amplifikationssignale, 
Replikationsursprunge und dergleichen. Geeignete regulatorische Sequenzen sind z.B. be- 
schrieben in Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic 
Press, San Diego, CA (1 990). 

Zusatzlich zu den artifiziellen Regulationssequenzen kann die naturliche Regulationssequenz 
vor dem eigentlichen Strukturgen noch vorhanden sein. Durch genetische Veranderung kann 
diese naturliche Regulation gegebenenfalls ausgeschaltet und die Expression der Gene erhoht 
Oder emiedrigt werden. Das Genkonstrukt kann aber auch einfacher aufgebaut sein, das heilit 
es werden keine zusatzlichen Regulationssignale vor das Strukturgen insertiert und der naturli- 
che Promotor mit seiner Regulation wird nicht entfernt. Statt dessen wird die naturliche Regulati- 
onssequenz so mutiert, dass keine Regulation mehr erfolgt und die Genexpression gesteigert 
Oder verringert wird. Die Nukleinsauresequenzen konnen in einer oder mehreren Kopien im 
Genkonstrukt enthalten sein. 

Beispiele fur brauchbare Promotoren sind: die Promotoren, ddh, amy, lysC, dapA, lysA aus Co- 
rynebacterium glutamicum, aber auch gram-positiven Promotoren SP02 wie sie in Bacillus Sub- 
tilis and Its Closest Relatives, Sonenshein, Abraham L,Hoch, James A., Losick, Richard; ASM 
Press, District of Columbia, Washington und Patek M. Eikmanns BJ. Patek J. Sahm H. Microbio- 
logy. 142 1297-309, 1996 beschrieben sind, oder aber auch cos-, tac-, trp-, tet-, trp-tet-, Ipp-, lac- 
, Ipp-lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, l-PR- oder im l-PL-Promotor, die vorteilhaft- 
erweise in gram-negativen Bakterien Anwendung finden. Bevorzugt ist auch die Verwendung 
induzierbarer Promotoren, wie z.B. licht- und insbesondere temperaturinduztierbarer Promoto- 
ren, wie der P r P r Promotor. Prinzipiell konnen alle naturlichen Promotoren mit ihren Regulations- 
sequenzen verwendet werden. Dartiber hinaus konnen auch synthetische Promotoren vorteilhaft 
verwendet werden. 

Die genannten regulatorischen Sequenzen sollen die gezielte Expression der Nukleinsaurese- 
quenzen und der Proteinexpression ermoglichen. Dies kann beispielsweise je nach Wirtsorga- 
nismus bedeuten, dass das Gen erst nach Induktion exprimiert oder uberexprimiert wird, oder 
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dass es sofort exprimiert und/oder Qberexprimiert wird. 

Die regulatorischen Sequenzen bzw. Faktoren k6nnen dabei vorzugsweise die Expression posi- 
tivbeeinflussen und dadurch erhohen odererniedrigen. So kann eine Verstarkung der regulato- 
rischen Elemente vorteilhafterweise auf der Transkriptionsebene erfolgen, indem starke 
Transkriptionssignale wie Promotoren und/oder "Enhancer" verwendetwerden. Daneben istaber 
auch eine Verstarkung der Translation m6glich, indem beispielsweise die Stabilitat der mRNA 
verbessert wird. 

Die Herstellung einer Expressionskassette erfolgt durch Fusion eines geeigneten Promotors, 
einergeeigneten Shine-Dalgarnow-Sequenz mit einer metA-Nukleotidsequenzsowieeinem ge- 
eigneten Terminationssignal. Dazu verwendet man gangige Rekombinations- und Klonie- 
rungstechniken, wie sie beispielsweise in Current Protocols in Molecular Biology, 1993, John 
Wiley & Sons. Incorporated, New York New York, PCR Methods, Gelfand, David H., Innis, Mi- 
chael A., Sninsky, John J. 1999, Academic Press, Incorporated, California, San Diego, ., PCR 
Cloning Protocols, Methods in Molecular Biology Ser., Vol. 192, 2nd ed., Humana Press, New 
Jersey, Totowa. T. Maniatis, E.F. Fritsch und J. Sambrook, Molecular Cloning: A Laboratory Ma- 
nual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) sowie in T.J. Silhavy, M.L. 
Berman und L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, 
Cold Spring Harbor, NY (1984) und in Ausubel, F.M. etal., Current Protocols in Molecular Biolo- 
gy, Greene Publishing Assoc. and Wiley Interscience (1987) beschrieben sind. 

Das rekombinante Nukleinsaurekonstrukt bzw. Genkonstrukt wird zur Expression in einem ge- 
eigneten Wirtsorganismus vorteilhafterweise in einen wirtsspezifischen Vektor insertiert, der eine 
optimale Expression der Gene im Wirt ermdglicht. Vektoren sind dem Fachmann wohl bekannt 
und konnen beispielsweise aus "Cloning Vectors" (Pouwels P. H. etal., Hrsg, Elsevier, Amster- 
dam-New York-Oxford, 1985) entnommen werden. Unter Vektoren sind aulier Plasmiden auch 
alle anderen dem Fachmann bekannten Vektoren, wie beispielsweise Phagen, Transposons, IS- 
Elemente, Phasmide, Cosmide, und lineare oder zirkulare DNA zu verstehen. Diese Vektoren 
konnen autonom im Wirtsorganismus repliziert oder chromosomal repliziert werden. 

Zur Verstarkung wurden erfindungsgemafte metA-Gene beispielhaft mit Hilfe von episomalen 
Plasmiden uberexprimiert. Als Plasmide eignen sich solche, die in coryneformen Bakterien repli- 
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ziert werden. Zahlreiche bekannte Plasmidvektoren, wie z. B. pZ1 (Menkel etal., Applied and 
Environmental Microbiology (1989) 64: 549-554), pEKExl (Eikmanns et al. ( Gene 102: 93-98 
(1991)) Oder pHS2-1 (Sonnen et aL, Gene 107: 69-74 (1991)) beruhen auf den kryptischen 
Plasmiden pHM1519, pBL1 Oder pGA1 . Andere Plasmidvektoren, wie z. B. pCLiKSMCS, oder 
5 solche, die auf pCG4 (US-A 4,489,1 60) oder pNG2 (Serwold-Davis et al., FEMS Microbiology 
Letters 66, 1 19-124 (1990)) oder pAG1 (US-A 5,158,891) beruhen, konnen in gleicher Weise 
verwendet werden. 

Weiterhin eignen sich auch solche Plasmidvektoren mit Hilfe derer man das Verfahren der Ge- 
1 0 namplifikation durch Integration in das Chromosom anwenden kann, so wie es beispielsweise 
von Remscheid etal. (Applied and Environmental Microbiology 60,126-132 (1994))zurDuplika- 
tion bzw. Amplifikation des hom-thrB-Operons beschrieben wurde. Bei dieser Methode wird das 
vollstandige Gen in einen Plasmidvektor kloniert, der in einem Wirt (typischerweise E. coli), nicht 
aberin C. glutamicum replizieren kann. Als Vektoren kommen beispielsweise pSUP301 (Simon 
15 et aL, Bio/ Technology 1,784-791 (1983)), pK18mob oder pK19mob (Schafer et aL, Gene 
145,69-73 (1994)), Bernard et aL, Journal ofMoIecular Biology, 234: 534-541 (1993)), pEM1 
(Schrumpf et aL 1991 , Journal of Bacteriology 173: 451 0-451 6) oder pBGS8 (Spratt etal., 1986, 
Gene 41: 337-342) in Frage. Der Plasmidvektor, der das zu amplifizierende Gen enthalt, wird 
anschlieftend durch Transformation in den gewQnschten Stamm von C. glutamicum uberfuhrt. 
20 Methoden zu r Transformation sind beispielsweise bei Thierbach et al. (Applied Microbiology and 
Biotechnology 29, 356-362 (1 988)), Dunican und Shivnan (Biotechnology 7, 1 067-1 070 (1 989)) 
und Tauch et aL (FEMS Microbiological Letters 123,343-347 (1994)) beschrieben. 

Enzyme konnen durch Mutationen in den korrespondierenden Genen derart in ihrer Aktivitat 
25 beeinflulit werden, dass es zu einer teilweisen oder vollstandigen Verringerung der Reaktions- 
geschwindigkeit der enzymatischen Reaktion kommt. Beispiele filr solche Mutationen sind dem 
Fachmann bekannt (Motoyama H. Yano H. Terasaki Y. Anazawa H. Applied & Environmental 
Microbiology. 67:3064-70, 2001, Eikmanns BJ. Eggeling L Sahm H. Antonie van Leeuwenhoek. 
64:145-63, 1993-94.) 

30 

Zusatzlich kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben einer Expression bzw. Verstarkung eines erfindungsgemaften 
metA-Gen eines oder mehrere Enzyme des jeweiligen Biosyntheseweges, des Cystein- 
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Stoffwechselwegs, der Apratatsemialdehyd-Synthese, der Glykolyse, der Anaplerotik, des Pen- 
tose-Phosphat-Stoffwechsels, des Zitronensaure-Zyklus Oder des Aminosaure-Exports zu ver- 
starken. 

5 So kann fur die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
eines oder mehrere der folgenden Gene verstarkt sein: 

- das fOr eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 
-das fur eine Aspartat-Semialdehyd kodierende Gen asd (EP 1 108 790 A2; DNA-SEQ NO. 
282), 

10 - das fOr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierende Gen gap (Eikmanns 
(1992), Journal of Bacteriology 174: 6076-6086), 

- das fOr die 3-Phosphoglycerat Kinase kodierende Gen pgk (Eikmanns (1992), Journal of 
Bacteriology 174: 6076-6086), 

- das fur die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1992), Journal of Bacteriology 
15 174:6076-6086), 

- das fur die Triosephosphat Isomerase kodierende Gen tpi (Eikmanns (1 992), Journal of Bacte- 
riology 174: 6076-6086), 

- das fOr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

- das fur die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
20 NO. 3491), 

- das fur die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

• - das fOr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 1110), 

25 - das fOr die O-Acetylhomoserin-Sulfhydrylase kodierende Gen metY (EP 1 1 08 790 A2; DNA- 
SEQ NO. 726), 

- das fur die Methylentetrahydrofolat-Reduktase kodierende Gen metF (EP 1 1 08 790 A2; DNA- 
SEQ NO. 2379), 

- das fOr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
30 SEQ NO. 928) 

- eines fOr die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 108 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fOr die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 1 08 790 A2; DNA-SEQ NO. 
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2818) 

- das fur eine Homoserin-Dehydrogenase kodierende Gen hom (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 

5 So kann fur die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin in 
coryneformen Bakterien,vorteilhaftsein, gleichzeitigwenigstenseinesdernachfolgenden Gene 
zu mutieren, so dass die korrespondierenden Proteine, verglichen mit nicht mutierten Proteinen, 
in geringerem MafJe oder nicht durch einen Stoffwechselmetaboliten in ihrer Aktivitat beeinflusst 
werden: 

10 

• - das ftir eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 
- das fur die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1992), Journal of Bacteriology 
174: 6076-6086), 

- das fdr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

15 - das fur die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3491), 

- das fQr die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

- das fQr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 1 08 790 A2; DNA-SEQ 
20 NO. 1110), 

- das fOr die O-Acetylhomoserin-Sulfhydrylase kodierende Gen metY (EP 1 1 08 790 A2; DNA- 
SEQ NO. 726), 

• - das fOr die Methylentetrahydrofolat-Reduktase kodierende Gen metF (EP 1 1 08 790 A2; DNA- 
SEQ NO. 2379), 

25 - das fOr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

- eines fur die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fOr die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 1 08 790 A2; DNA-SEQ NO 
30 2818) 

- das fOr eine Homoserin-Dehydrogenase kodierende Gen hom (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 
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Weiterhin kann es fur die Produktion von schwefelhaltlge Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
mafien metA-Gene eines oder mehrere der folgenden Gene abzuschwachen, insbesondere 
deren Expression zu verringern, oder auszuschalten: 

- das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 108 790 A2; DNA-SEQ NO. 3453) 

- das filr die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 

- das fur die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 
10 - das fOr die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 

DNA-SEQ NO. 3494) 

- das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 108 790 A2; DNA- 
SEQ NO. 3157) 

- das fOr die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
15 SEQNO. 950) 

- das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 

- das fur die Dihydrodipicolinat Synthase kodiernde Gen dapA (EP 1 108 790 A2; DNA-SEQ NO. 
3476) 

- das fOr die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
20 NO. 3477) 

- das fur die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 108 790 A2; DNA-SEQ 
NO. 3451) 





Weiterhin kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
25 Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
malien metA-Gene in Coryneformen Bakterien gleichzeitig wenigstens eines derfolgenden Ge- 
ne so zu mutieren, dass die enzymatische Aktivitat des korrespondierenden Proteins teilweise 
oder vollstandig verringert wird: 

30 - das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 1 08 790 A2; DNA-SEQ NO. 3453) 

- das fOr die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 

- das fur die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 
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- das fur die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 

- das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 108 790 A2; DNA- 
SEQ NO. 3157) 

5 - das fur die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

- das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 

- das fur die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 108 790 A2; DNA-SEQ NO. 
3476) 

10 - das fur die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 

»NO. 3477) 
- das fur die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 108 790 A2; DNA-SEQ 
NO. 3451) 

15 Weiterhin kann es ftir die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben der Expression bzw. Verstarkung eines erfindungsgemalien 
metA-Gens unerwunschte Nebenreaktionen auszuschalten (Nakayama: "Breeding of Amino 
Acid Producing Microorganisms", in: Overproduction of Microbial Products, Krumphanzl, Sikyta, 
Vanek (eds.), Academic Press, London, UK, 1982). 



Die erfindungsgem3(J hergestellten Mikroorganismen konnen kontinuierlich oderdiskontinuier- 
lich im batch- Verfahren (Satzkultivierung) Oder im fed batch (Zulaufverfahren) Oder repeated fed 

* batch Verfahren (repetitives Zulaufverfahren) zur Produktion von schwefelhaltige Feinchemika- 
lien, insbesondere L-Methionin, kultiviertwerden. EineZusammenfassung uberbekannte Kulti- 
25 vierungsmethoden ist im Lehrbuch von Chmiel (Bioprozefitechnik 1 . Einfuhrung in die Bioverfah- 
renstechnik (Gustav Fischer Verlag, Stuttgart, 1991))oder im Lehrbuch von Storhas (Bioreakto- 
ren und periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994))zufinden. 

Das zu verwendende Kulturmedium hat in geeigneter Weise den Anspruchen der jeweiligen 
30 Stamme zu genugen. Beschreibungen von Kulturmedien verschiedener Mikroorganismen sind 
im Handbuch "Manual of Methods fur General Bacteriology" der American Society fur Bacterio- 
logy (Washington D. C, USA, 1981) enthalten. 



20 
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Diese erfindungsgemali einsetzbaren Medien umfassen gewohnlich eine oder mehrerenKoh- 
lenstoffquellen, Stickstoffquellen, anorganische Salze, Vitamine und/oder Spurenelemente. 

Bevorzugte Kohlenstoffquellen sind Zucker, wie Mono-, Di- oder Polysaccharide. Sehr gute Koh- 
5 lenstoffquellen sind beispielsweise Glucose, Fructose, Mannose, Galactose, Ribose, Sorbose, 
Ribulose, Lactose, Maltose, Saccharose, Raffinose, Starke oder Cellulose. Man kann Zucker 
auch Qber komplexe Verbindungen, wie Melassen, oder andere Nebenprodukte der Zucker- 
Raffinierung zu den Medien geben. Es kann auch vorteilhaft sein, Gemische verschiedener Koh- 
lenstoffquellen zuzugeben. Andere mogliche Kohlenstoffquellen sind Ole und Fette wie z. B. 
10 Sojaol. SonnenblumenoL ErdnuBol und Kokosfett, Fettsauren wie z. B. Palmitinsaure, Stearin- 

• saure oder Linolsaure, Alkohole wie z. B. Glycerin, Methanol oder Ethanol und organische Sau- 
ren wie z. B. EssigsSure oder Milchsaure. 

Stickstoffquellen sind gewohnlich organische oder anorganische Stickstoffverbindungen oder 
1 5 Materialien, die diese Verbindungen enthalten. Beispielhafte Stickstoffquellen umfassen Ammo- 
niak-Gas oder Ammoniumsalze, wie Ammoniumsulfat, Ammoniumchlorid, Ammoniumphosphat, 
Ammoniumcarbonat oder Ammoniumnitrat, Nitrate, Harnstoff, Aminosauren oder komplexe 
Stickstoffquellen, wie Maisquellwasser, Sojamehl, Sojaprotein, Hefeextrakt, Fleischextraktund 
andere. Die Stickstoffquellen konnen einzeln oder als Mischung verwendet werden. 

20 

Anorganische Salzverbindungen, die in den Medien enthalten sein konnen, umfassen die Chlo- 
rid-, Phosphor- oder Sulfatsalze von Calcium, Magnesium, Natrium, Kobalt, MolybdSn, Kalium, 
^j^^ Mangan, Zink, Kupfer und Eisen 

25 Als Schwefelquelle fur die Herstellung von schwefelhaltigen Feinchemikalien, insbesondere von 
Methionin, konnen anorganische schwefelhaltige Verbindungen wie beispielsweise Sulfate, Sulfi- 
te, Dithionite, Tetrathionate, Thiosulfate, Sulfide aber auch organische Schwefelverbindungen, 
wie Mercaptane und Thiole, verwendet werden. 

30 Als Phosphorquelle konnen Phosphorsaure, Kaliumdihydrogenphosphat oder Dikaliumhydro- 
genphosphat oder die entsprechenden Natrium haltigen Salze verwendet werden. 

Chelatbildner konnen zum Medium gegeben werden, urn die Metallionen in Losung zu halten. 
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Besonders geeignete Chelatbildner umfassen Dihydroxyphenole, wie Catechol oder Protocate- 
chuat, oder organische Sauren, wie Citronensaure. 

Die erfindungsgemafi eingesetzten Fermentationsmedien enthalten Qblicherweise auch andere 
Wachstumsfaktoren, wie Vitamine oder Wachstumsforderer, zu denen beispielsweise Biotin, 
Riboflavin, Thiamin, Folsaure, Nikotinsaure, Panthothenat und Pyridoxin gehoren. Wachstums- 
faktoren und Salze stammen haufig von komplexen Medienkomponenten, wie Hefeextrakt, Me- 
lassen, Maisquellwasserund dergleichen. Dem Kulturmedium konnen uberdies geeignete Vor- 
stufen zugesetzt werden. Die genaue Zusammensetzung der Medienverbindungen hangt stark 
vom jeweiligen Experiment ab und wird fiir jeden spezifischen Fall individuell entschieden. In- 
formation uberdie Medienoptimierung ist erhaltlich aus dem Lehrbuch "Applied Microbiol. Physi- 
ology, A Practical Approach" (Hrsg. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) S. 53-73, 
ISBN 019 963577 3). Wachstumsmedien lassen sich auch von kommerzielten Anbietern bezie- 
hen, wie Standard 1 (Merck) oder BHI (Brain heart infusion, DIFCO) und dergleichen. 

Samtliche Medienkomponenten werden, entwederdurch Hitze (20 min bei 1,5 bar und 121 °C) 
oder durch Sterilfiltration, 'sterilisiert. Die Komponenten konnen entweder zusammen oder noti- 
genfalls getrennt sterilisiert werden. Samtliche Medienkomponenten kQnnen zu Beginn der An- 
zucht zugegen sein oderwahlfrei kontinuierlich oder chargenweise hinzugegeben werden. 

Die Temperatur der Kultur liegt normalerweise zwischen 1 5°C und 45°C, vorzugsweise bei 25°C 
bis 40°C und kann wahrend des Experimentes konstant gehalten oder verandert werden. Der 
pH-Wert des Mediums sollte im Bereich von 5 bis 8,5, vorzugsweise um 7,0 liegen. Der pH-Wert 
fur die Anzucht lalit sich wahrend der Anzucht durch Zugabe von basische Verbindungen wie 
Natriumhydroxid, Kaliurnhydroxid, Ammoniak bzw. Ammoniakwasser oder saure Verbindungen 
wie Phosphorsaure oder Schwefelsaure kontrollieren. Zur Kontrolle der Schaumentwicklung 
konnen Antischaummitte,! wie z. B. Fettsaurepolyglykolester, eingesetzt werden. Zur Aufrechter- 
haltung der Stabilitat von Plasmiden kQnnen dem Medium geeignete selektiv wirkende Stoffe, 
wie z. B. Antibiotika, hinzugefQgt werden. Um aerobe Bedingungen aufrechtzuerhalten, werden 
Sauerstoff oder Sauerstoff haltige Gasmischungen, wie z. B. Umgebungsluft, in die Kultur einge- 
tragen. Die Temperatur der Kultur liegt normalerweise bei 20°C bis 45°C und. Die Kultur wird 
solange fortgesetzt, bis sich ein Maximum des gewunschten Produktes gebildet hat. Dieses Ziel 
wird normalerweise innerhalb von 10 Stunden bis 160 Stunden erreicht. 
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Die so erhaltenen, insbesondere L-Methionin enthaltenden, Ferrnentationsbruhen haben 
Qblicherweise eine Trockenmasse von 7,5 bis 25 Gew.-%. 

5 Vorteilhaft ist aufterdem auch, wenn die Fermentation zumindest am Ende, insbesondere jedoch 
uber mindestens 30% der Fermentationsdauer zuckerlimitiert gefahren wird. Das heifit, dass 
wShrend dieser Zeit die Konzentration an verwertbarem Zucker im Fermentationsmedium auf ^ 0 
bis 3 g/l gehalten, beziehungsweise abgesenkt wird. 

«Die Fermentationsbruhe wird anschlie(Jend weiterverarbeitet Je nach Anforderung kann die 
Biomasse ganz Oder teilweise durch Separationsmethoden, wie z. B. Zentrifugation, Filtration, 
Dekantieren oder einer Kombination dieser Methoden aus der Fermentationsbruhe entfemt oder 
vollstandig in ihr belassen werden. 

1 5 Anschliefiend kann die FermentationsbrGhe mit bekannten Methoden, wie z. B. mit Hilfe eines 
Rotationsverdampfers, Dunnschichtverdampfers, Fallfilmverdampfers, durch Umkehrosmose, 
oder durch Nanofiltration, eingedickt beziehungsweise aufkonzentriert werden. Diese aufkon- 
zentrierte Fermentationsbruhe kann anschlieliend durch Gefriertrocknung, SprOhtrocknung, 
SprOhgranulation oder durch anderweitige Verfahren aufgearbeitet werden. 

20 

Es ist aber auch moglich die schwefelhaltigen Feinchemikalien, insbesonder L-Methionin, weiter 
aufzureinigen. Hierzu wird die produkthaltige Bruhe nach dem Abtrennen der Biomasse einer 

• Chromatographie mit einem geeigneten Harz unterworfen, wobei das gewdnschte Produkt oder 
die Verunreinigungen ganz oder teilweise auf dem Chromatographieharz zuruckgehalten wer- 
25 den. Diese Chromatographieschritte konnen notigenfalls wiederholt werden, wobei die gleichen 
oder andere Chromatographieharze verwendet werden. Der Fachmann ist in der Auswahl der 
geeigneten Chromatographieharze und ihrer wirksamsten Anwendung bewandert. Das gereinig- 
te Produkt kann durch Filtration oder Ultrafiltration konzentriert und bei einer Temperaturaufbe- 
wahrt werden, bei der die Stabilitat des Produktes maximal ist. 

30 

Die Identitat und Reinheit der isolierten Verbindung(en) kann durch Techniken des Standes der 
Technik bestimmt werden. Diese umfassen Hochleistungs-Flussigkeitschromatographie (HPLC), 
spektroskopische Verfahren, Farbeverfahren, DQnnschichtchromatographie, NIRS, Enzymtest 
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oder mikrobiologische Tests. Diese Analyseverfahren sind zusammengefaflt in: Patek et al. 
(1994) Appl. Environ. Microbiol. 60:133-140; Malakhova etal. (1996) Biotekhnologiya 1 1 27-32; 
und Schmidt et ai. (1998) Bioprocess Engineer. 19:67-70. Ulmann's Encyclopedia of Industrial 
Chemistry (1996) Bd. A27, VCH: Weinheim, S. 89-90, S. 521-540, S. 540-547, S. 559-566, 575- 
5 581 und S. 581-587; Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry and Mo- 
lecular Biology, John Wiley and Sons; Fallon, A. et al. (1987) Applications of HPLC in Bioche- 
mistry in: Laboratory Techniques in Biochemistry and Molecular Biology, Bd. 17. 

Die Erfindung wird nun anhand derfolgenden nicht-limitierenden Beispiele naher beschrieben: 

Beispiel 1: Konstruktion von pCLiKSMCS 

Zunachst wurden Ampicillinresistenz und Replikationsursprung des Vektors pBR322 mit den 
Oligonukleotiden p1.3 (SEQ ID NO:47) und p2.3 (SEQ ID NO:48) mit Hilfe der Polymerase- 
1 5 Kettenreaktion (PCR) amplifiziert. 

p1.3(SEQIDNO:47) 

5'-CCCGGGATCCGCTAGCGGCGCGCCGGCCGGCCCGGTGTGAAATACCGCACAG-3' 

20 p2.3 (SEQ ID NO:48) 

5 , -TCTAGACTCGAGCGGCCGCGGCCGGCCTTTAAATTGAAGACGAAAGGGCCTCG-3 c 

Neben den zu pBR322 komplementaren Sequenzen, enthaltdas Oligonukleotid p1.3 (SEQ ID 
NO:47) in 5 -3* Richtung die Schnittstellen fOrdie Restriktionsendonukleasen Smal, BamHI, Nhel 

25 und AscI und das Oligonukleotid p2.3 (SEQ ID NO:48) in 5-3' Richtung die Schnittstellen fQr 
die Restriktionsendonukleasen Xbal, Xhol, Notl und Dral. Die PCR Reaktion wurde nach Stan- 
dardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applications, Academic 
Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchgefuhrt. Das erhalte- 
ne DNA Fragment mit einer Grofie von ungefahr 2,1 kb wurde mit dem GFX™PCR, DNA and 

30 Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gerei- 
nigt. Die stumpfen Enden des DNA-Fragmentes wurden mit dem Rapid DNA Ligation Kit (Roche 
Diagnostics, Mannheim) nach Angaben des Herstellers miteinanderligiert und der Ligationsan- 
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satz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, 
Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XHBlue (Stratagene, La Jolla, 
USA) transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren 
auf Ampicillin (50pg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht 

Die Plasmid-DNA eines individuellen Klons wurde mft dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiKI . 

Ausgehend vom Plasmid pWLT1 (Liebl et al., 1 992) als Template fQr eine PCR Reaktion wurde 
mit den Oligonukleotiden neol (SEQ ID NO:49) und neo2 (SEQ ID NO:50) eine Kanamycin- 
Resistenzcassette amplifiziert. 

neol (SEQ ID NO:49): 

S-GAGATCTAGACCCGGGGATCCGCTAGCGGGCTGCTAAAGGAAGCGGA-S 1 
neo2 (SEQ ID NO:50): 

S'-GAGAGGCGCGCCGCTAGCGTGGGCGAAGAACTCCAGCA-S' 

Neben den zu pWLT1 komplementaren Sequenzen, enthalt das Oligonukleotid neol in 5-3 1 
Richtung die Schnittstellen furdie Restriktionsendonukleasen Xbal, Smal, BamHI, Nhel und das 
Oligonukleotid neo2 (SEQ ID NO:50) in 5'-3' Richtung die Schnittstellen furdie Restriktionsen- 
donukleasen AscI und Nhel. Die PCR Reaktion wurde nach Standardmethode wie Innis et al. 
(PCR Protocols. A Guide to Methods and Applications, Academic Press (1990)) mit PfuTurbo 
Polymerase (Stratagene, La Jolla, USA) durchgefuhrt. Das erhaltene DNA Fragment mit einer 
GrofSe von ungefahr 1 ,3 kb wurde mit dem GFX™PCR, DNA and Gel Band Purification Kit (A- 
mersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt Das DNA-Fragment 
wurde mit den Restriktionsendonukleasen Xbal und AscI (New England Biolabs, Beverly, USA) 
geschnitten und im AnschlufS daran erneut mit dem GFX™PCR, DNA and Gel Band Purification 
Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Der Vektor 
pCLiKI wurde ebenfalls mit den Restriktionsendonukleasen Xbal und AscI geschnitten und mit 
alkalischer Phosphatase (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde der linearisierte 
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Vektor (ca. 2,1 kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharma- 
cia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit Hilfe 
des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers mit 
dem geschnittenen PCR Fragment ligiert und der Ligationsansatz nach Standardmethoden wie 
5 in Sambrook et at. (Molecular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrie- 
ben(1989)), in kompetente E.coli XL-1 Blue (Stratagene, La Jolla, USA) transformiert Eine Selek- 
tion auf Plasmid tragende Zellen wurde durch das Ausplattieren auf Ampicillin (50pg/ml) und 
Kanamycin (20ng/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

10 Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus Oberprilft. Das so 
erhaltene Plasmid erhalt den Namen pCUK2. 

Der Vektor pCLiK2 wurde mit der Restriktionsendonuklease Dral (New England Biolabs, Beverly, 
15 USA) geschnitten. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde ein ca. 2,3 kb 
grolies Vektorfragment mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham 
Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit 
Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
religiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Clo- 
20 ning. A Laboratory Manual, Cold Spring Harbor, beschrieben (1989)), in kompetente E.coli XL- 
1Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende Zellen 
wurde durch das Ausplattieren auf Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1 955, Viro- 
'^^^ logy, 1:190) erreicht. 

25 Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus uberprtift. Das so 
erhaltene Plasmid erhalt den Namen pCUK3. 

Ausgehend vom Plasmid pWLQ2 (Liebl etal., 1992) als Template fur eine PCR Reaktion wurde 
30 mit den Oligonukleotiden cg1 ((SEQ ID NO:51) und cg2 (SEQ ID NO:52) der Replikation- 
sursprung pHM1519 amplifiziert. 

cg1 (SEQIDNO:51): 
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S'-GAGAGGGCGGCCGCGCAAAGTCCCGCTTCGTGAA-S* 
cg2 (SEQ ID NO:52): 

S-GAGAGGGCGGCCGCTCAAGTCGGTCAAGCCACGC-S 1 

Neben den zu pWLQ2 komplementaren Sequenzen, enthalten die Oligonukleotide cg1 (SEQ ID 
NO:51 ) und cg2 (SEQ ID NO:52) Schnittstellen fOr die Restriktionsendonuklease Notl. Die PCR 
Reaktion wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and 
Applications, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) 
durchgefuhrt. Das erhaltene DNA Fragment mit einer GrofJe von ungefahr2,7 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im Anschlufi daran erneut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
1 5 des Herstellers gereinigt. Der Vektor pCLiK3 wurde ebenfalls mit der Restriktionsendonuklease 
Notl geschnitten und mit alkalischer Phosphatase (Roche Diagnostics, Mannheim)) nach Anga- 
ben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wur- 
de der linearisierte Vektor (ca. 2,3kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit 
(Amersham Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor- 
20 Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach An- 
gaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der Ligationsansatz 
nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, Cold 
Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1Blue (Stratagene, La Jolla, USA) 
transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren auf 
25 Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 




Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus Qberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK5. 

FOr die Erweiterung von pCLikS urn eine ^multiple cloning site" (MCS) wurden die beide syntheti- 
schen, weitestgehend komplementaren Oligonukleotide HS445 ((SEQ ID NO:53) und HS446 
(SEQ ID NO:54), die Schnittstellen fur die Restriktionsendonukleasen Swal, Xhol, Aatl, Apal, 
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Asp718 f Mlul f Ndel, Spel, EcoRV, Sail, Clal, BamHI, Xbal und Smal enthalten, durch gemein- 
sames erhitzen auf 95°C und langsames abkuhlen zu einem doppelstrSngigen DNA-Fragment 
vereinigt. 

5 HS445 (SEQ ID NO:53): 

S-TCGAATTTAAATCTCGAGAGGCCTGACGTCGGGCCCGGTACCACGCGTCATATGACTAG 

TTCGGACCTAGGGATATCGTCGACATCGATGCTCTTCTGCGTTAATTAACAATTGGGATCC 

TCTAGACCCGGGATTTAAAT-3 , 

1 0 HS446 (SEQ ID NO:54): 

S-GATCATTTAAATCCCGGGTCTAGAGGATCCCAATTGTTAATTAACGCAGAAGAGCATCGA 
TGTCGACGATATCCCTAGGTCCGAACTAGTCATATGACGCGTGGTACCGGGCCCGACGTC 
AGGCCTCTCGAGATTTAAAT-3 1 

15 Der Vektor pCUK5 wurde mit den Restriktionsendonuklease Xhol und BamHI (New England 
Biolabs, Beverly, USA) geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, 
Mannheim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 
0,8%igen Agarosegel wurde der linearisierte Vektor (ca. 5,0 kb) mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 

20 liert Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
Mannheim) nach Angaben des Herstellers mit dem synthetischen Doppelstrangigen DNA- 
Fragment ligiert und der Ligationsansatz nach Standardmethoden wie in Sambrooketal. (Mole- 

• cular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente 
E.coli XL-1 Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende 
25 Zellen wurde durch das Ausplattieren auf Kanamycin (20|jg/ml) haltigen LB Agar (Lennox, 1 955, 
Virology, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus OberprQft. Das so 
30 erhaltene Plasmid erhalt den Namen pCUK5MCS. 

Sequenzierungsreaktionen wurden nach Sanger etal. (1977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefuhrt Die Sequenzierreaktionen wurden mittels 
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ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 

Das entstandene Plasmid pCLiKSMCS ist als SEQ ID NO: 57 aufgefuhrt. 

5 Beispiel 2: Konstruktion von pCLiKSMCS integrativ sacB 

Ausgehend vom Plasmid pK1 9mob (Schafer et al. f Gene 145,69-73(1 994)) ais Template fur eine 
PCR Reaktion wurde mit den Oligonukleotiden BK1732 und BK1733 das Bacillus subtilis sacB 
Gen (kodierend fQr Levan Sucrase) amplifiziert. 




BK1732 (SEQ ID NO:55): 

S'-GAGAGCGGCCGCCGATCCTTTTTAACCCATCAC-S' 



BK1733 (SEQ ID NO:56): 
1 5 5 4 -AGGAGCGGCCGCCATCGGCATTTTCTTTTGCG-3 4 

Neben den zu pEK19mobsac komplementaren Sequenzen, enthalten die Oligonukleotide 
BK1732 und BK1733 Schnittstellen fur die Restriktionsendonuklease Notl. Die PCR Reaktion 
wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applica- 
20 tions, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchge- 
fuhrt Das erhaltene DNA Fragment mit einer Grofie von ungefahr 1 ,9 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 

• des Herstellers gereinigt Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im Anschlufi daran erneut mit dem 
25 GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. 

Der Vektor pCUK5MCS (hergestellt gemaR Beispiel 1 ) wurde ebenfalls mit der Restriktionsen- 
donuklease Notl geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, Mann- 
30 heim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen 
Agarosegel wurde ein ungefahr 2,4 kb grofies Vektorfragment mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 
liert Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
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Mannheim) nach Angaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der 
Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laborato- 
ry Manual, Cold Spring Harbor, beschrieben(1 989)), in kompetente E.coli XL-1 Blue (Stratagene, 
La Jolla, USA) transformiert Eine Selektion auf Plasmid tragende Zellen wurde durch das Aus- 
5 plattieren auf Kanamycin (20Mg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1 :190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCUKSMCS integrativ sacB. 

B Sequenzierungsreaktionen wurden nach Sanger et al. (1 977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefuhrt. Die Sequenzierreaktionen wurden mittels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 

15 Das entstandene Plasmid pCUKSMCS integrativ sacB ist als SEQ ID NO: 58 aufgefQhrt. 

Weitere Vektoren die zur erfindungsgemaften Expression Oder Oberproduktion von metA-Genen 
geeignet sind, konnen in analoger Weise herstellt werden. 



M/43127 



MetA 



m 

BASF Aktiengesellschaft 
PatentansprOche 



20020290 
1 



0000053875 



10 




15 



Verfahren zur fermentativen Herstellung wenigstens einer schwefelhaltigen 
Feinchemikalie, welches folgende Schritte umfasst: 

a) Fermentation einer die gewunschte schwefelhaltige Feinchemikalie 
produzierenden coryneformen Bakterienkultur, wobei in den coryneformen 
Bakterien zumindest eine heterologe Nukleotidsequenz exprimiert wird, 
welche fur ein Protein mit Homoserin-O-Acetyl-Transferase (metA}-Aktivitat 
kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den 
Zellen der Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie. 

Verfahren nach Anspruch 1, wobei die schwefelhaltige Feinchemikalie L-Methionin 
umfasst. 



20 



Verfahren nach einem der vorhergehenden Anspruche, wobei die heterologe metA- 
kodierende Nukleotidsequenz zur metA-kodierenden Sequenz aus Corynebacterium 
glutamicum ATCC 13032 eine Sequenzhomologie vom weniger als 100% aufweist. 




Verfahren nach Anspruch 3, wobei die metA-kodierende Sequenz aus einem der 
folgenden Organismen abgeleitet ist: 



Corynebacterium diphteriae 


ATCC 14779 


Mycobacterium leprae 


ATCC 43910 


Mycobacterium tuberculosis CDC1551 


ATCC 25584 


Chlorobium tepidum 


ATCC 49652 i 


Pseudomonas aeruginosa 


ATCC 17933 


Caulobacter crescentus 


ATCC 19089 


Neisseria gonorrhoeae 


ATCC 53420 


Neisseria meningitidis 


ATCC 53414 


Pseudomonas fluorescens 


ATCC 13525 


Burkholderia cepacia 


ATCC 25416 


Nitrosomonas europaea 


ATCC 19718 


Haemophilus influenzae 


ATCC 51907 


Halobacterium sp NRC1 


ATCC 33170 


Thermus thermophilus 


ATCC 27634 
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Deinococcus radiodurans 


ATCC 13939 


Saccharomyces cerevisiae 


ATCC 10751 


Schizosaccharomyces pombe 


ATCC 24969 


Xylella fastidiosa 


ATCC 35881 


Emericella nidulans 


ATCC 36104 


Mesorhizobium loti 


ATCC 35173 


Acremonium crysogenum 


ATCC 11550 


Pseudomonas putida 


ATCC 47054 


Staphylococcus aureus 


ATCC 35556 



5. Verfahren nach einem der vorhergehenden AnsprOche, wobei die metA-kodierende 
Sequenzeine kodierende Sequenz gemafi SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 
21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, und 45 Oder eine dazu homologe 
Nukleotidsequenz, welche fur ein Protein mit metA-Aktivitat kodiert, umfasst. 

6. Verfahren nach einem der vorhergehenden AnsprOche, wobei die metA-kodierende 
Sequenz fOr ein Protein mit metA-Aktivitat kodiert, wobei das Protein eine 
Aminosauresequenz gemafi SEQ ID NO:2,4, 6,8, 10, 12, 14, 16, 18,20,22,24,26, 28, 
30, 32, 34, 36, 38, 40, 42, 44,und 46 oder eine dazu homologe Aminosauresequenz, 
welche fQr ein Protein mit metA-Aktivitat steht, umfasst. 

7. Verfahren nach einem der vorhergehenden AnsprOche, wobei die kodierende metA- 
Sequenz eine in coryneformen Bakterien replizierbare oder eine stabil in das 
Chromosom intregrierte DNA oder eine RNA ist 

8. Verfahren gemafi Anspruch 7, wobei man 

a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der 
wenigstens eine Kopie der kodierenden metA-Sequenz unter der Kontrolle 
regulativer Sequenzen tragt, oder 

b) einen Stamm einsetzt, in dem die kodierende metA-Sequenz in das Chromosom 
des Bakteriums integriert wurde 

9. Verfahren nach einem der vorhergehenden AnsprOche, wobei die kodierende metA- 
Sequenz uberexprimiert wird. 
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10. Verfahren gemali einem der vorhergehenden AnsprQche, wobei man Bakterien 
fermentiert, in denen zusatzlich wenigstens ein weiteres Gen des Biosyntheseweges der 
gewQnschten schwefelhaltigen Feinchemikalie verstarkt ist Oder derart mutiert ist, dass 
es durch Stoffwechselmetabolite nicht in seiner Aktivitat beeinflusst wird. 

11. Verfahren gemali einem der vorhergehenden Anspruche, wobei man Bakterien 
fermentiert, in denen wenigstens ein Stoffwechselweg zumindestteilweise ausgeschaltet 
sind, der die Bildung der gewQnschten schwefelhaltigen Feinchemikalie verringert. 

12. Verfahren gemali einem der vorhergehenden AnsprQche, wobei man coryneforme 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fOr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fQr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

c) dem fur die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

d) dem fQr die Pyruvat Carboxylase kodierenden Gen pyc, 

e) dem fQr die Triosephosphat Isomerase kodierenden Gen tpi, 

f) dem fur die Methylentetrahydrofolat Reduktase kodierenden Gen metF, 

g) dem fur die Cystahionin-gamma-Synthase kodierenden Gen metB, 

h) dem fur die Cystahionin-gamma-Lyase kodierenden Gen metC, 

i) dem fQr die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 
j) dem fQr die O-Acetylhomoserin-Sulfhydrylase kodierenden Gen metY, 
k) dem fQr das metH Gen, das fQr die Vitamin B12 abhangige Methionin-Synthase 



m) dem serB Gen, das fur die Phosphoserin-Phosphatase kodiert, 
n) dem cysE Gen, das fur die Serine Acetyl-Transferase kodiert, und 
o) dem horn Gen, das eine Homoserin-Dehydrogenase kodiert, 

uberexprimiert Oder so mutiert ist, dass die korrespondierenden Proteine, verglichen mit 
nicht mutierten Proteinen, in geringerem Malie Oder nicht durch Stoffwechselmetabolite 
in ihrer Aktivitat beeinflusst werden. 



I) 



kodiert, 

serC Gen, das fur die Phosphoserin-Aminotransferase kodiert, 
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# 

15 

14. 

20 

15. 




25 



30 

16. 



Verfahren gemali einem der vorhergehenden AnsprQche, wobei man coryneformen 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fQr die Homoserine-Kinase kodierenden Gen thrB, 

b) dem fQr die Threonin Dehydratase kodierenden Gen ilvA, 

c) dem fur die Threonin Synthase kodierenden Gen thrC 

d) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 

e) dem fur die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 

f) dem fur die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 

g) dem fur die Pyruvat-Oxidase kodierenden Gen poxB, 

h) dem fur die Dihydrodipicolinat Synthase kodiernden Gen dapA, 

i) dem fQr die Dihydrodipicolinat Reduktase kodiernden Gen dapB; oder 
j) dem fur die Diaminopicolinat Decarboxylase kodiernden Gen 

durch Veranderung der Expressionsrate oderdurch Einfuhrung einergezielten Mutation 
abschwacht ist 

Verfahren gemali einem oder mehreren der vorhergehenden AnsprQche, wobei man 
Mikroorganismen <der Art Corynebacterium glutamicum einsetzt. 

Verfahren zur Herstellung eines L-Methionin haltigen Tierfuttermittel-Additivs aus 
Fermentationsbruhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden 
Mikroorganismus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen Fermentationsbruhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemali b) und/oder c) erhaltenen Fermentationsbruhe, urn das 
Tierfuttermittel-Additiv in dergewQnschten PuIver-oderGranulatformzu erhalten. 

Verfahren gemali Anspruch 15, wobei man Mikroorganismen gemali der Definition in 
einem der AnsprQche 1 bis 14 einsetzt. 
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Zusammenfassung 

Die Erfindung betrifft Verfahren zur fermentativen Herstellung von schwefelhaltlgen 
Feinchemikalien, insbesondere L-Methionin, unter Verwendung von Bakterien, in denen eine fOr 
5 ein Methionin-Synthase (metA)-Gen kodierende Nukleotidsequenzen exprimiert wird. 




M/43127 



MetA 



SEQUENZPROTOKOLL 



<110> BASF Aktiengesellschaf t 

<120> MetA 

<130> M/43127 

<140> 

<141> 



<160> 58 

<210> 1 
<211> 1104 
<212> DNA 

<213> Corynebacterium diphteriae 

<220> 

1> CDS 

2> (1) . . (1101) 
23> RDI00386 




<400> 1 

atg etc acc acc aca ggg acg etc acg cac caa aaa ate gga gac ttt 

Met Leu Thr Thr Thr Gly Thr Leu Thr His Gin Lys lie Gly Asp Phe 

1 5 10 15 

tac acc gaa gec gga gcg acg ctt cac gac gta acc ate gec tac caa 

Tyr Thr Glu Ala Gly Ala Thr Leu His Asp Val Thr lie Ala Tyr Gin 

20 25 30 

gca tgg ggc cac tac acc ggc acc aat etc ate gtt etc gaa cat gec 

Ala Trp Gly His Tyr Thr Gly Thr Asn Leu lie Val Leu Glu His Ala 

35 40 45 



ctg acc ggc gac tct aac get att tea tgg tgg gac gga ctg att ggc 
Leu Thr Gly Asp Ser Asn Ala lie Ser Trp Trp Asp Gly Leu lie Gly 
50 55 60 



ggc aaa gca etc gac acc aac cgc tac tgc ate eta tgc acc aac 
Gly Lys Ala Leu Asp Thr Asn Arg Tyr Cys lie Leu Cys Thr Asn 
5 70 75 80 



gtg etc gga gga tgc aaa gga tec acc gga ccg age agt cca cac cca 
Val Leu Gly Gly Cys Lys Gly Ser Thr Gly Pro Ser Ser Pro His Pro 
85 90 95 



gac gga aaa cca 
Asp Gly Lys Pro 
100 

ctt gtc aat gec 
Leu Val Asn Ala 
115 

att cac gca ate 
lie His Ala He 
130 

tgg get gca etc 
Trp Ala Ala Leu 

M/43127 



tgg gga tec aga 
Trp Gly Ser Arg 



gaa aaa caa ctt 
Glu Lys Gin Leu 
12 0 

ate ggc gga tec 
He Gly Gly Ser 
135 

cac cca cac atg 
His Pro His Met 



ttt cca gee ctt 
Phe Pro Ala Leu 
105 

ttc gac cac etc 
Phe Asp His Leu 



atg gga ggc gca 
Met Gly Gly Ala 
140 

atg acg act gga 
Met Thr Thr Gly 



tea ate cgt gac 
Ser He Arg Asp 
110 

ggc ate aat aaa 
Gly He Asn Lys 
125 

cgc acc etc gaa 
Arg Thr Leu Glu 



ttc gtc ata gca 
Phe Val He Ala 



96 

144 

192 

240 

288 

336 

384 

432 

480 

MetA 




145 150 155 160 

gtc tea gca cgc gca age get tgg caa ate ggt att caa act gca caa 52 8 
Val Ser Ala Arg Ala Ser Ala Trp Gin lie Gly lie Gin Thr Ala Gin 
165 170 175 

ate age gee ata gaa etc gac ccc cac tgg aac ggc ggc gat tac tac 576 
He Ser Ala He Glu Leu Asp Pro His Trp Asn Gly Gly Asp Tyr Tyr 
180 185 190 

age ggt cac gca cca tgg gaa gga ate gee gee get cgc egg ate gee 624 
Ser Gly His Ala Pro Trp Glu Gly He Ala Ala Ala Arg Arg He Ala 
195 200 205 

cac etc ace tat cgc ggc gaa eta gaa ata gac gaa cga ttc ggc act 672 
His Leu Thr Tyr Arg Gly Glu Leu Glu He Asp Glu Arg Phe Gly Thr 
210 215 220 

tec gca caa cac ggt gaa aac cca etc ggc ccc ttc cga gat cca cat 720 
Ser Ala Gin His Gly Glu Asn Pro Leu Gly Pro Phe Arg Asp Pro His 
25 230 235 240 

aa cgt ttt gcg gtc acg age tac etc caa cac caa ggc ate aaa etc 768 
Gin Arg Phe Ala Val Thr Ser Tyr Leu Gin His Gin Gly He Lys Leu 
245 250 255 

get caa cga ttc gat gca ggt agt tac gtc gtg ctt acc gaa gee etc 816 
Ala Gin Arg Phe Asp Ala Gly Ser Tyr Val Val Leu Thr Glu Ala Leu 
260 265 270 

aat cgt cat gac ate gga cgc ggc cga ggc gga etc aac aaa gee etc 864 
Asn Arg His Asp He Gly Arg Gly Arg Gly Gly Leu Asn Lys Ala Leu 
275 280 285 

age gca ate aca gtc ccc ate atg att get ggc gtt gat acc gat att 912 
Ser Ala He Thr Val Pro He Met He Ala Gly Val Asp Thr Asp He 
290 295 300 



etc tac ccc tat cac cag caa gaa cac eta tea cga aat eta ggc aac 960 
Leu Tyr Pro Tyr His Gin Gin Glu His Leu Ser Arg Asn Leu Gly Asn 
05 310 315 320 



'a etc get atg gca aaa ate age tea cca gta ggc cac gac get ttc 1008 
eu Leu Ala Met Ala Lys He Ser Ser Pro Val Gly His Asp Ala Phe 
325 330 335 

etc aca gaa ttc cga caa atg gag cga ate eta aga cat ttc atg gag 1056 
Leu Thr Glu Phe Arg Gin Met Glu Arg He Leu Arg His Phe Met Glu 
340 345 350 

ctt teg gaa gga ate gac gat tec ttc cga acc aaa eta gag cgc 1101 
Leu Ser Glu Gly He Asp Asp Ser Phe Arg Thr Lys Leu Glu Arg 
355 360 365 

tga 1104 

<210> 2 
<211> 367 
<212> PRT 

<213> Corynebacterium diphteriae 
<400> 2 



M/43127 



MetA 



# • 




Met Leu Thr Thr Thr Gly Thr Leu Thr His Gin Lys lie Gly Asp Phe 
15 10 15 

Tyr Thr Glu Ala Gly Ala Thr Leu His Asp Val Thr lie Ala Tyr Gin 
20 25 30 

Ala Trp Gly His Tyr Thr Gly Thr Asn Leu lie Val Leu Glu His Ala 
35 40 45 

Leu Thr Gly Asp Ser Asn Ala lie Ser Trp Trp Asp Gly Leu lie Gly 
50 55 60 

Pro Gly Lys Ala Leu Asp Thr Asn Arg Tyr Cys lie Leu Cys Thr Asn 
65 70 75 80 

Val Leu Gly Gly Cys Lys Gly Ser Thr Gly Pro Ser Ser Pro His Pro 
85 90 95 

Asp Gly Lys Pro Trp Gly Ser Arg Phe Pro Ala Leu Ser lie Arg Asp 
100 ^ 105 110 

u Val Asn Ala Glu Lys Gin Leu Phe Asp His Leu Gly lie Asn Lys 
115 120 125 

lie His Ala lie lie Gly Gly Ser Met Gly Gly Ala Arg Thr Leu Glu 
130 135 140 

Trp Ala Ala Leu His Pro His Met Met Thr Thr Gly Phe Val lie Ala 
145 150 155 160 

Val Ser Ala Arg Ala Ser Ala Trp Gin lie Gly lie Gin Thr Ala Gin 
165 170 175 

lie Ser Ala lie Glu Leu Asp Pro His Trp Asn Gly Gly Asp Tyr Tyr 
180 185 190 

Ser Gly His Ala Pro Trp Glu Gly He Ala Ala Ala Arg Arg He Ala 
195 200 205 

His Leu Thr Tyr Arg Gly Glu Leu Glu He Asp Glu Arg Phe Gly Thr 
210 215 220 



^^^^ 



Ala Gin His Gly Glu Asn Pro Leu Gly Pro Phe Arg Asp Pro His 
"25 230 235 240 

Gin Arg Phe Ala Val Thr Ser Tyr Leu Gin His Gin Gly He Lys Leu 
245 250 255 

Ala Gin Arg Phe Asp Ala Gly Ser Tyr Val Val Leu Thr Glu Ala Leu 
260 265 270 

Asn Arg His Asp He Gly Arg Gly Arg Gly Gly Leu Asn Lys Ala Leu 
275 280 285 

Ser Ala He Thr Val Pro He Met He Ala Gly Val Asp Thr Asp He 
290 295 300 

Leu Tyr Pro Tyr His Gin Gin Glu His Leu Ser Arg Asn Leu Gly Asn 
305 310 315 320 



Leu Leu Ala Met Ala Lys He Ser Ser Pro Val Gly His Asp Ala Phe 
325 330 335 

M/43127 MetA 
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Leu Thr Glu Phe Arg Gin Met Glu Arg He Leu Arg His Phe Met Glu 
340 345 350 



Leu Ser Glu Gly He Asp Asp Ser Phe Arg Thr Lys Leu Glu Arg 
355 360 365 



<210> 3 
<211> 1149 
<212> DNA 

<213> Mycobacterium leprae 

<220> 

<221> CDS 

<222> (1) . . (1146) 

<223> RML02951 



<220> 

<221> unsure 



22> 224 . . 224 
*223> All occurrences of n indicate any nucleotide 

<400> 3 

atg aca ate tec aag gtc cct acc cag aag ctg ccg gec gaa ggc gag 48 

Met Thr He Ser Lys Val Pro Thr Gin Lys Leu Pro Ala Glu Gly Glu 
15 10 15 

gtc ggc ttg gtc gac ate ggc tea ctt acc acc gaa age ggt gee gtc 96 
Val Gly Leu Val Asp He Gly Ser Leu Thr Thr Glu Ser Gly Ala Val 
20 25 30 

ate gac gat gtc tgc ate gee gtt cag cgc tgg ggg gaa ttg teg ccc 144 
He Asp Asp Val Cys He Ala Val Gin Arg Trp Gly Glu Leu Ser Pro 
35 40 45 

acg cga gac aac gta gtg atg gta ctg cat gca etc acc ggt gac teg 192 
Thr Arg Asp Asn Val Val Met Val Leu His Ala Leu Thr Gly Asp Ser 
50 55 60 

p ate acc ggg ccc gee gga ccg gga cat enc aca ccc ggc tgg tgg 240 
He Thr Gly Pro Ala Gly Pro Gly His Xaa Thr Pro Gly Trp Trp 
65 70 75 80 

gac tgg ata get gga ccg ggt gca cca ate gac acc aac cgc tgg tgc 2 88 
Asp Trp He Ala Gly Pro Gly Ala Pro He Asp Thr Asn Arg Trp Cys 
85 90 95 

gcg ata gec acc aac gtg ctg ggc ggt tgc cgt ggc tec acc ggc cct 3 36 
Ala He Ala Thr Asn Val Leu Gly Gly Cys Arg Gly Ser Thr Gly Pro 
100 105 110 

agt teg ctt gee cgc gac gga aag cct tgg ggt tea aga ttt ccg ctg 384 
Ser Ser Leu Ala Arg Asp Gly Lys Pro Trp Gly Ser Arg Phe Pro Leu 
115 120 125 

ata tct ata cgc gac cag gta gag gca gat ate get gca ctg gec gee 432 
He Ser He Arg Asp Gin Val Glu Ala Asp He Ala Ala Leu Ala Ala 
130 135 140 

atg gga att aca aag gtt gee gec gtc gtt gga gga tct atg ggc ggg 4 80 
Met Gly He Thr Lys Val Ala Ala Val Val Gly Gly Ser Met Gly Gly 
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* 




145 150 155 160 

gcg cgt gca ctg gaa tgg ate ate ggc cac ccg gac caa gtc egg gee 528 
Ala Arg Ala Leu Glu Trp lie lie Gly His Pro Asp Gin Val Arg Ala 
165 170 175 

ggg ctg ttg ctg gcg gtc ggt gtg cgc gec acc gec gac cag ate ggc 576 
Gly Leu Leu Leu Ala Val Gly Val Arg Ala Thr Ala Asp Gin lie Gly 
180 185 190 

acc caa acc acc caa ate gca gec ate aag aca gac ccg aac tgg caa 624 
Thr Gin Thr Thr Gin lie Ala Ala He Lys Thr Asp Pro Asn Trp Gin 
195 200 205 

ggc ggt gac tac tac gag aca ggg agg gca cca gag aac ggc ttg aca 672 
Gly Gly Asp Tyr Tyr Glu Thr Gly Arg Ala Pro Glu Asn Gly Leu Thr 
210 215 220 

att gee cgc cgc ttc gee cac ctg acc tac cgc age gag gtc gag etc 720 
He Ala Arg Arg Phe Ala His Leu Thr Tyr Arg Ser Glu Val Glu Leu 
5 230 235 240 

r ac acc egg ttt gec aac aac aac caa ggc aat gag gac ccg gcg acg 768 
Asp Thr Arg Phe Ala Asn Asn Asn Gin Gly Asn Glu Asp Pro Ala Thr 
245 250 255 

ggc ggg cgt tac gca gtg cag agt tac eta gag cac cag ggt gac aag 816 
Gly Gly Arg Tyr Ala Val Gin Ser Tyr Leu Glu His Gin Gly Asp Lys 
260 265 270 

eta ttg gee cgc ttt gac gca ggc age tac gtg gtc ttg acc gaa acg 864 
Leu Leu Ala Arg Phe Asp Ala Gly Ser Tyr Val Val Leu Thr Glu Thr 
275 280 285 

ctg aac age cac gac gtt ggc egg ggc cgc gga ggg ate ggt aca gcg 912 

Leu Asn Ser His Asp Val Gly Arg Gly Arg Gly Gly He Gly Thr Ala 
290 295 300 

ctg cgc ggg tgc ccg gta ccg gtg gtg gtg ggt ggc att acc teg gat 960 
u Arg Gly Cys Pro Val Pro Val Val Val Gly Gly lie Thr Ser Asp 

310 315 320 



^gg 



gg etc tac cca ctg cgc ttg cag cag gag ctg gee gag atg ctg ccg 1008 
Arg Leu Tyr Pro Leu Arg Leu Gin Gin Glu Leu Ala Glu Met Leu Pro 
325 330 335 

ggc tgc acc ggg ctg cag gtt gta gac tec acc tac ggg cac gac ggc 1056 
Gly Cys Thr Gly Leu Gin Val Val Asp Ser Thr Tyr Gly His Asp Gly 
340 345 350 

ttc ctg gtg gaa tec gag gee gtc ggc aaa ttg ate cgt caa acc etc 1104 
Phe Leu Val Glu Ser Glu Ala Val Gly Lys Leu lie Arg Gin Thr Leu 
355 360 365 

gaa ttg gee gac gtg ggt tec aag gaa gac gcg tgt teg caa 1146 
Glu Leu Ala Asp Val Gly Ser Lys Glu Asp Ala Cys Ser Gin 
370 375 380 

tga 1149 
<210> 4 



M/43127 



MetA 




<211> 382 
<212> PRT 

<213> Mycobacterium leprae 
<220> 

<221> unsure 
<222> 75 . . 75 

<223> All occurrences of Xaa indicate any amino acid 
<400> 4 

Met Thr lie Ser Lys Val Pro Thr Gin Lys Leu Pro Ala Glu Gly Glu 
15 10 15 

Val Gly Leu Val Asp He Gly Ser Leu Thr Thr Glu Ser Gly Ala Val 
20 25 30 

He Asp Asp Val Cys He Ala Val Gin Arg Trp Gly Glu Leu Ser Pro 
35 40 45 

Thr Arg Asp Asn Val Val Met Val Leu His Ala Leu Thr Gly Asp Ser 
50 55 60 

Is He Thr Gly Pro Ala Gly Pro Gly His Xaa Thr Pro Gly Trp Trp 
65 70 75 80 

Asp Trp He Ala Gly Pro Gly Ala Pro He Asp Thr Asn Arg Trp Cys 
85 90 95 

Ala He Ala Thr Asn Val Leu Gly Gly Cys Arg Gly Ser Thr Gly Pro 
100 105 110 

Ser Ser Leu Ala Arg Asp Gly Lys Pro Trp Gly Ser Arg Phe Pro Leu 
115 120 125 

He Ser He Arg Asp Gin Val Glu Ala Asp He Ala Ala Leu Ala Ala 
130 135 140 

Met Gly He Thr Lys Val Ala Ala Val Val Gly Gly Ser Met Gly Gly 
145 150 155 160 



a Arg Ala Leu Glu Trp He He Gly His Pro Asp Gin Val Arg Ala 
165 170 175 



y Leu Leu Leu Ala Val Gly Val Arg Ala Thr Ala Asp Gin He Gly 
180 185 190 

Thr Gin Thr Thr Gin He Ala Ala He Lys Thr Asp Pro Asn Trp Gin 
195 200 205 

Gly Gly Asp Tyr Tyr Glu Thr Gly Arg Ala Pro Glu Asn Gly Leu Thr 
210 215 ~ 220 

He Ala Arg Arg Phe Ala His Leu Thr Tyr Arg Ser Glu Val Glu Leu 
225 230 235 240 

Asp Thr Arg Phe Ala Asn Asn Asn Gin Gly Asn Glu Asp Pro Ala Thr 
245 250 255 

Gly Gly Arg Tyr Ala Val Gin Ser Tyr Leu Glu His Gin Gly Asp Lys 
260 265 270 

Leu Leu Ala Arg Phe Asp Ala Gly Ser Tyr Val Val Leu Thr Glu Thr 
275 280 285 
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Leu Asn Ser His Asp Val Gly Arg Gly Arg Gly Gly He Gly Thr Ala 
290 295 300 

Leu Arg Gly Cys Pro Val Pro Val Val Val Gly Gly He Thr Ser Asp 
305 310 315 320 

Arg Leu Tyr Pro Leu Arg Leu Gin Gin Glu Leu Ala Glu Met Leu Pro 
325 330 335 

Gly Cys Thr Gly Leu Gin Val Val Asp Ser Thr Tyr Gly His Asp Gly 
340 345 350 

Phe Leu Val Glu Ser Glu Ala Val Gly Lys Leu He Arg Gin Thr Leu 
355 360 365 

Glu Leu Ala Asp Val Gly Ser Lys Glu Asp Ala Cys Ser Gin 
370 375 380 



k 210> 5 

11> 1140 
212> DNA 
<213> Mycobacterium tuberculosis 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> RMTB03565 

<400> 5 

atg acg ate tec gat gta ccc acc cag acg ctg ccc gec gaa ggc gaa 4 8 

Met Thr He Ser Asp Val Pro Thr Gin Thr Leu Pro Ala Glu Gly Glu 
15 10 15 

ate ggc ctg ata gac gtc ggc teg ctg caa ctg gaa age ggg gcg gtg 96 
He Gly Leu He Asp Val Gly Ser Leu Gin Leu Glu Ser Gly Ala Val 
20 25 30 



ate gac gat gtc tgt ate gee gtg caa cgc tgg ggc aaa ttg teg ccc 144 
le Asp Asp Val Cys He Ala Val Gin Arg Trp Gly Lys Leu Ser Pro 
35 40 45 



ca egg gac aac gtg gtg gtg gtc ttg cac gcg etc acc ggc gac teg 192 
Ala Arg Asp Asn Val Val Val Val Leu His Ala Leu Thr Gly Asp Ser 
50 55 60 

cac ate act gga ccc gee gga ccc ggc cac ccc acc ccc ggc tgg tgg 240 
His He Thr Gly Pro Ala Gly Pro Gly His Pro Thr Pro Gly Trp Trp 
65 70 75 80 

gac ggg gtg gee ggg ccg agt gcg ccg att gac acc acc cgc tgg tgc 2 88 
Asp Gly Val Ala Gly Pro Ser Ala Pro He Asp Thr Thr Arg Trp Cys 
85 90 95 

gcg gta get acc aat gtg etc ggc ggc tgc cgc ggc tec acc ggg ccc 33 6 
Ala Val Ala Thr Asn Val Leu Gly Gly Cys Arg Gly Ser Thr Gly Pro 
100 105 "* 110 

age teg ctt gee cgc gac gga aag cct tgg ggc tea aga ttt ccg ctg 3 84 
Ser Ser Leu Ala Arg Asp Gly Lys Pro Trp Gly Ser Arg Phe Pro Leu 
115 120 125 
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ate teg ata cgt gac cag gtg cag gcg gac gtc gcg gcg ctg gee gcg 
lie Ser He Arg Asp Gin Val Gin Ala Asp Val Ala Ala Leu Ala Ala 
130 135 140 

ctg ggc ate acc gag gtc gee gee gtc gtc ggc ggc tec atg ggc ggc 
Leu Gly lie Thr Glu Val Ala Ala Val Val Gly Gly Ser Met Gly Gly 
145 150 155 160 

gec egg gee ctg gaa tgg gtg gtc ggc tac ccg gat egg gtc cga gee 
Ala Arg Ala Leu Glu Trp Val Val Gly Tyr Pro Asp Arg Val Arg Ala 
165 170 175 

gga ttg ctg ctg gcg gtc ggt gcg cgt gec acc gca gac cag ate ggc 
Gly Leu Leu Leu Ala Val Gly Ala Arg Ala Thr Ala Asp Gin He Gly 
180 185 190 

acg cag aca acg caa ate gcg gec ate aaa gee gac ccg gac tgg cag 
Thr Gin Thr Thr Gin lie Ala Ala He Lys Ala Asp Pro Asp Trp Gin 
195 200 205 

w gc ggc gac tac cac gag acg ggg agg gca cca gac gec ggg ctg cga 
Ser Gly Asp Tyr His Glu Thr Gly Arg Ala Pro Asp Ala Gly Leu Arg 
210 215 220 

etc gee cgc cgc ttc gcg cac etc acc tac cgc ggc gag ate gag etc 
Leu Ala Arg Arg Phe Ala His Leu Thr Tyr Arg Gly Glu He Glu Leu 
225 230 235 240 

gac acc egg ttc gec aac cac aac cag ggc aac gag gat ccg acg gee 
Asp Thr Arg Phe Ala Asn His Asn Gin Gly Asn Glu Asp Pro Thr Ala 
245 250 255 

ggc ggg cgc tac gcg gtg caa agt tat ctg gaa cac caa gga gac aaa 
Gly Gly Arg Tyr Ala Val Gin Ser Tyr Leu Glu His Gin Gly Asp Lys 
260 265 270 

ctg tta tec egg ttc gac gee ggc age tac gtg att etc acc gag gcg 
Leu Leu Ser Arg Phe Asp Ala Gly Ser Tyr Val He Leu Thr Glu Ala 
275 280 285 



tc aac age cac gac gtc ggc cgc ggc cgc ggc ggg gtc tec gcg get 
Leu Asn Ser His Asp Val Gly Arg Gly Arg Gly Gly Val Ser Ala Ala 
290 295 300 

ctg cgc gee tgc ccg gtg ccg gtg gtg gtg ggc ggc ate acc tec gac 
Leu Arg Ala Cys Pro Val Pro Val Val Val Gly Gly He Thr Ser Asp 
305 310 315 320 

egg etc tac ccg ctg cgc ctg cag cag gag ctg gee gac ctg ctg ccg 
Arg Leu Tyr Pro Leu Arg Leu Gin Gin Glu Leu Ala Asp Leu Leu Pro 
325 330 335 

ggc tgc gee ggg ctg cga gtc gtc gag teg gtc tac gga cac gac ggc 
Gly Cys Ala Gly Leu Arg Val Val Glu Ser Val Tyr Gly His Asp Gly 
340 345 350 

ttc ctg gtg gaa acc gag gee gtg ggc gaa ttg ate cgc cag aca ctg 
Phe Leu Val Glu Thr Glu Ala Val Gly Glu Leu He Arg Gin Thr Leu 
355 360 365 
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432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



MetA 





gga ttg get gat cgt gaa ggc gcg tgt egg egg tga 114 0 

Gly Leu Ala Asp Arg Glu Gly Ala Cys Arg Arg 
370 375 

<210> 6 
<211> 379 
<212> PRT 

<213> Mycobacterium tuberculosis 
<400> 6 

Met Thr lie Ser Asp Val Pro Thr Gin Thr Leu Pro Ala Glu Gly Glu 
15 10 15 

lie Gly Leu lie Asp Val Gly Ser Leu Gin Leu Glu Ser Gly Ala Val 
20 25 30 

lie Asp Asp Val Cys lie Ala Val Gin Arg Trp Gly Lys Leu Ser Pro 
35 40 45 

k la Arg Asp Asn Val Val Val Val Leu His Ala Leu Thr Gly Asp Ser 
50 55 60 

His He Thr Gly Pro Ala Gly Pro Gly His Pro Thr Pro Gly Trp Trp 
65 70 75 80 

Asp Gly Val Ala Gly Pro Ser Ala Pro He Asp Thr Thr Arg Trp Cys 
85 90 95 

Ala Val Ala Thr Asn Val Leu Gly Gly Cys Arg Gly Ser Thr Gly Pro 
100 105 110 

Ser Ser Leu Ala Arg Asp Gly Lys Pro Trp Gly Ser Arg Phe Pro Leu 
115 120 125 

He Ser He Arg Asp Gin Val Gin Ala Asp Val Ala Ala Leu Ala Ala 
130 135 140 

Leu Gly He Thr Glu Val Ala Ala Val Val Gly Gly Ser Met Gly Gly 
145 150 155 160 

a Arg Ala Leu Glu Trp Val Val Gly Tyr Pro Asp Arg Val Arg Ala 
165 170 175 

Gly Leu Leu Leu Ala Val Gly Ala Arg Ala Thr Ala Asp Gin He Gly 
180 185 190 

Thr Gin Thr Thr Gin He Ala Ala He Lys Ala Asp Pro Asp Trp Gin 
195 200 205 

Ser Gly Asp Tyr His Glu Thr Gly Arg Ala Pro Asp Ala Gly Leu Arg 
210 215 220 

Leu Ala Arg Arg Phe Ala His Leu Thr Tyr Arg Gly Glu He Glu Leu 
225 230 235 240 

Asp Thr Arg Phe Ala Asn His Asn Gin Gly Asn Glu Asp Pro Thr Ala 
245 250 255 

Gly Gly Arg Tyr Ala Val Gin Ser Tyr Leu Glu His Gin Gly Asp Lys 
260 265 270 

Leu Leu Ser Arg Phe Asp Ala Gly Ser Tyr Val He Leu Thr Glu Ala 
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275 280 285 

Leu Asn Ser His Asp Val Gly Arg Gly Arg Gly Gly Val Ser Ala Ala 
290 295 300 

Leu Arg Ala Cys Pro Val Pro Val Val Val Gly Gly lie Thr Ser Asp 
305 310 315 320 

Arg Leu Tyr Pro Leu Arg Leu Gin Gin Glu Leu Ala Asp Leu Leu Pro 
325 330 ^ 335 

Gly Cys Ala Gly Leu Arg Val Val Glu Ser Val Tyr Gly His Asp Gly 
340 345 ~ 350 

Phe Leu Val Glu Thr Glu Ala Val Gly Glu Leu lie Arg Gin Thr Leu 
355 360 365 

Gly Leu Ala Asp Arg Glu Gly Ala Cys Arg Arg 
370 375 



• 



10> 7 
'211> 972 
<212> DNA 
<213> Chlorobium tepidum 

<220> 
<221> CDS 
<222> (1) . . (969) 
<223> RCL01447 

<400> 7 



gtg 
Val 
l 


agg 
Arg 


gtc 
Val 


get 
Ala 


tac 
Tyr 
5 


cgt 
Arg 


acc 
Thr 


tgg 

Trp 


ggt 
Gly 


acg 
Thr 
10 


eta 
Leu 


aac 
Asn 


gca 
Ala 


gag 
Glu 


aaa 
Lys 
15 


age 
Ser 


48 


aac 
Asn 


gtg 
Val 


att 
He 


ctg 
Leu 
20 


gtc 
Val 


tgc 
Cys 


cac 
His 


gcg 
Ala 


ctg 
Leu 
25 


acc 
Thr 


ggc 
Gly 


aac 
Asn 


gee 
Ala 


gac 
Asp 
30 


gee 
Ala 


gac 
Asp 


96 




tgg 
Trp 


tgg 
Trp 
35 


tgc 
Cys 


ggc 
Gly 


atg 
Met 


ttc 
Phe 


ggt 

Gly 
40 


gag 
Glu 


gga 
Gly 


egg 
Arg 


gcg 
Ala 


ttc 
Phe 
45 


gac 
Asp 


gag 
Glu 


act 
Thr 


144 


egg 
Arg 


gac 
Asp 
50 


ttc 
Phe 


ate 
He 


gta 
Val 


tgc 
Cys 


age 
Ser 
55 


aac 
Asn 


gtg 
Val 


ctt 
Leu 


gga 
Gly 


age 
Ser 
60 


tgc 
Cys 


tac 
Tyr 


gga 
Gly 


acg 
Thr 


192 


acc 
Thr 
65 


ggg 

Gly 


ccg 
Pro 


atg 
Met 


teg 
Ser 


gtg 
Val 
70 


aat 
Asn 


ccg 
Pro 


ctg 
Leu 


agt 
Ser 


ggc 
Gly 
75 


agg cac 
Arg His 


tac 
Tyr 


ggt 
Gly 


ccc 
Pro 
80 


240 


gat 
Asp 


ttt 

Phe 


ccg 
Pro 


cgc 
Arg 


att 
He 
85 


acc 
Thr 


att 

He 


cgc 
Arg 


gac 
Asp 


atg 
Met 
90 


gtg 
Val 


aat 
Asn 


gtt 

Val 


cag 
Gin 


cga 
Arg 
95 


tta 
Leu 


288 


ttg 
Leu 


ctt 
Leu 


cgt 
Arg 


teg 
Ser 
100 


etc 
Leu 


ggc 
Gly 


ate 
He 


gac 
Asp 


egg 
Arg 
105 


ate 
He 


egg 
Arg 


etc 
Leu 


ate 
He 


gtt 
Val 
110 


ggt 

Gly 


gca 
Ala 


336 


teg 
Ser 


ctt 
Leu 


ggc 

Gly 


ggg 

Gly 


atg 
Met 


cag 
Gin 


gtg 

Val 


etc 
Leu 


gaa 
Glu 


tgg 
Trp 


ggc 
Gly 


gca 
Ala 


atg 
Met 


tat 
Tyr 


ccc 
Pro 


gaa 
Glu 


384 



115 120 125 
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atg gcc ggg gcg ctg atg ccg atg ggc gtt teg ggt cgt cat teg gcg 432 

Met Ala Gly Ala Leu Met Pro Met Gly Val Ser Gly Arg His Ser Ala 
130 135 140 

tgg tgc ate gcg cag age gag gcg cag egg cag get ate gcc gcc gat 480 

Trp Cys lie Ala Gin Ser Glu Ala Gin Arg Gin Ala lie Ala Ala Asp 

145 150 155 160 

gcg gag tgg caa gat ggc tgg tat gat ccg gag gtg cag cca cgc aaa 528 

Ala Glu Trp Gin Asp Gly Trp Tyr Asp Pro Glu Val Gin Pro Arg Lys 

165 170 175 

gga ctt gcc gcc gcg egg atg atg gcg atg tgc acc tac cgc tgc ttc 576 

Gly Leu Ala Ala Ala Arg Met Met Ala Met Cys Thr Tyr Arg Cys Phe 
180 185 190 

gag aac tac cag caa cgc ttt ggc cgc aag cag cgc gag gac ggc ttg 624 

Glu Asn Tyr Gin Gin Arg Phe Gly Arg Lys Gin Arg Glu Asp Gly Leu 
195 200 205 



c gaa gcc gaa age tac gtg cgt cac cag ggc gac aag ctg gtt ggg 672 

e Glu Ala Glu Ser Tyr Val Arg His Gin Gly Asp Lys Leu Val Gly 
210 215 220 

cgc ttt gat gca aac acc tat ate acg etc acc aga gcg atg gac atg 72 0 

Arg Phe Asp Ala Asn Thr Tyr lie Thr Leu Thr Arg Ala Met Asp Met 

225 230 235 240 



cac gac etc ggg cgc gga cgc gac tec tac gaa gcg gcg etc gga gcg 768 
His Asp Leu Gly Arg Gly Arg Asp Ser Tyr Glu Ala Ala Leu Gly Ala 
245 250 255 

ctg aag atg ccg gtc gag att etc tec ate gac teg gac gtg etc tat 816 
Leu Lys Met Pro Val Glu lie Leu Ser lie Asp Ser Asp Val Leu Tyr 
260 265 270 

ccc agg cag gag cag gag gaa ctt gcc cgc etc att ccc ggc tea cgc 864 
Pro Arg Gin Glu Gin Glu Glu Leu Ala Arg Leu lie Pro Gly Ser Arg 
275 280 285 



ctt ttc ctt gac gaa ccc tat ggc cac gac gcc ttt ctt ate gac 912 
eu Leu Phe Leu Asp Glu Pro Tyr Gly His Asp Ala Phe Leu lie Asp 
290 295 300 

acc gag acc gtc age cgc atg gtc tgc gag ttc aag agg cag ttg ata 960 
Thr Glu Thr Val Ser Arg Met Val Cys Glu Phe Lys Arg Gin Leu lie 
305 310 315 320 

gtt gac aat tga 972 
Val Asp Asn 



<210> 8 
<211> 323 
<212> PRT 

<213> Chlorobium tepidum 
<4O0> 8 

Val Arg Val Ala Tyr Arg Thr Trp Gly Thr Leu Asn Ala Glu Lys Ser 
15 10 15 
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Asn Val lie Leu Val Cys His Ala Leu Thr Gly Asn Ala Asp Ala Asp 
20 25 30 

Ser Trp Trp Cys Gly Met Phe Gly Glu Gly Arg Ala Phe Asp Glu Thr 
35 40 45 

Arg Asp Phe He Val Cys Ser Asn Val Leu Gly Ser Cys Tyr Gly Thr 
50 55 60 

Thr Gly Pro Met Ser Val Asn Pro Leu Ser Gly Arg His Tyr Gly Pro 
65 70 75 80 

Asp Phe Pro Arg He Thr He Arg Asp Met Val Asn Val Gin Arg Leu 
85 90 95 

Leu Leu Arg Ser Leu Gly He Asp Arg He Arg Leu He Val Gly Ala 
100 105 110 

Ser Leu Gly Gly Met Gin Val Leu Glu Trp Gly Ala Met Tyr Pro Glu 
115 120 125 

fet Ala Gly Ala Leu Met Pro Met Gly Val Ser Gly Arg His Ser Ala 
130 135 140 

Trp Cys He Ala Gin Ser Glu Ala Gin Arg Gin Ala He Ala Ala Asp 
145 150 155 160 

Ala Glu Trp Gin Asp Gly Trp Tyr Asp Pro Glu Val Gin Pro Arg Lys 
165 170 175 

Gly Leu Ala Ala Ala Arg Met Met Ala Met Cys Thr Tyr Arg Cys Phe 
180 185 190 

Glu Asn Tyr Gin Gin Arg Phe Gly Arg Lys Gin Arg Glu Asp Gly Leu 
195 200 205 

Phe Glu Ala Glu Ser Tyr Val Arg His Gin Gly Asp Lys Leu Val Gly 
210 215 220 



g Phe Asp Ala Asn Thr Tyr He Thr Leu Thr Arg Ala Met Asp Met 
5 230 235 240 



is Asp Leu Gly Arg Gly Arg Asp Ser Tyr Glu Ala Ala Leu Gly Ala 
245 250 255 

Leu Lys Met Pro Val Glu He Leu Ser He Asp Ser Asp Val Leu Tyr 
260 265 270 

Pro Arg Gin Glu Gin Glu Glu Leu Ala Arg Leu He Pro Gly Ser Arg 
275 280 285 

Leu Leu Phe Leu Asp Glu Pro Tyr Gly His Asp Ala Phe Leu He Asp 
290 295 300 

Thr Glu Thr Val Ser Arg Met Val Cys Glu Phe Lys Arg Gin Leu He 
305 310 315 320 

Val Asp Asn 



<210> 9 
M/43127 



MetA 



<211> 1149 
<212> DNA 

<213> Caulobacter crescentus 



<220> 

<221> CDS 

<222> (1) . . (1146) 

<223> RCO00727 




<400> 9 

atg get gcg etc gat ccg ate acg ccc gec ggc ggg gga acc tgg egg 48 

Met Ala Ala Leu Asp Pro lie Thr Pro Ala Gly Gly Gly Thr Trp Arg 
15 10 15 

ttt cct gcg aat gaa cct ctg egg ctg gac tec gga ggc gtc ate gaa 96 
Phe Pro Ala Asn Glu Pro Leu Arg Leu Asp Ser Gly Gly Val lie Glu 
20 25 30 

ggt ctg gaa ate gee tac cag acc tac ggc cag ctg aac gcg gac aag 144 
Gly Leu Glu lie Ala Tyr Gin Thr Tyr Gly Gin Leu Asn Ala Asp Lys 
35 40 45 

fcc aac gec gtc ctg ate tgc cac gec ctg acg ggc gac cag cat gtg 192 
Ser Asn Ala Val Leu lie Cys His Ala Leu Thr Gly Asp Gin His Val 
50 55 60 

gee teg ccc cac ccc acc acc ggc aag ccc ggc tgg tgg caa cgc ctt 24 0 
Ala Ser Pro His Pro Thr Thr Gly Lys Pro Gly Trp Trp Gin Arg Leu 
65 70 75 80 

gtt ggt ccc ggt aag ccg ctg gat ccc gcg egg cac ttc ate ate tgc 288 
Val Gly Pro Gly Lys Pro Leu Asp Pro Ala Arg His Phe lie lie Cys 
85 90 95 

teg aac gtg ate ggc ggc tgc atg ggc teg acg ggc ccg gee teg ate 336 
Ser Asn Val lie Gly Gly Cys Met Gly Ser Thr Gly Pro Ala Ser lie 
100 105 110 

aat ccg gee acg ggc aag acc tat ggc ctg teg ttc cca gtc ate acc 3 84 
Asn Pro Ala Thr Gly Lys Thr Tyr Gly Leu Ser Phe Pro Val lie Thr 
115 120 125 



gee gat atg gtg egg gec cag gee atg ctg gtc tct gcg etc ggg 432 
e Ala Asp Met Val Arg Ala Gin Ala Met Leu Val Ser Ala Leu Gly 
130 135 140 

gtc gag acc ctg ttc gee gtc gtc ggc ggc teg atg ggc ggc atg cag 480 
Val Glu Thr Leu Phe Ala Val Val Gly Gly Ser Met Gly Gly Met Gin 
145 150 155 160 

gtc cag caa tgg gee gtg gac tat ccc gag egg atg ttc age gec gtg 528 
Val Gin Gin Trp Ala Val Asp Tyr Pro Glu Arg Met Phe Ser Ala Val 
165 170 175 

gtg ctg gec teg gec teg cgc cac teg gec cag aac ate gcg ttc cac 576 
Val Leu Ala Ser Ala Ser Arg His Ser Ala Gin Asn lie Ala Phe His 
180 185 190 

gag gtg ggc cgc cag gcg ate atg gec gat ccc gac tgg cgc ggc ggc 624 
Glu Val Gly Arg Gin Ala lie Met Ala Asp Pro Asp Trp Arg Gly Gly 
195 200 205 

gee tat gee gag cac ggc gtg egg ccc gag aag ggc ctg gee gtg gcg 672 

M/43127 MetA 



Ala Tyr Ala Glu His Gly Val Arg Pro Glu Lys Gly Leu Ala Val Ala 
210 215 220 

egg atg gec gcg cac ate ace tat ctg tec gag ccc gee ctg cag egg 720 
Arg Met Ala Ala His lie Thr Tyr Leu Ser Glu Pro Ala Leu Gin Arg 
225 230 235 240 

aag ttc ggc cgc gag eta cag cgc gac ggc etc tec tgg ggc ttt gac 768 
Lys Phe Gly Arg Glu Leu Gin Arg Asp Gly Leu Ser Trp Gly Phe Asp 
245 250 255 

gee gac ttc cag gtc gag age tat eta cgc cac cag ggg tec age ttc 816 
Ala Asp Phe Gin Val Glu Ser Tyr Leu Arg His Gin Gly Ser Ser Phe 
260 265 270 

gtc gac egg ttc gac gee aac age tat etc tac ate acc egg gee atg 864 
Val Asp Arg Phe Asp Ala Asn Ser Tyr Leu Tyr lie Thr Arg Ala Met 
275 280 285 

cjac tat ttc gac ate gee gee age cat ggc ggg gtg ctg gee aag gcg 912 
p Tyr Phe Asp lie Ala Ala Ser His Gly Gly Val Leu Ala Lys Ala 
290 295 300 

ttc acc cga gcg egg aat gtg cgc ttc tgc gtg ctg age ttc tec age 960 
Phe Thr Arg Ala Arg Asn Val Arg Phe Cys Val Leu Ser Phe Ser Ser 
305 310 315 320 

gac tgg etc tat ccg acc gee gag aac cgc cac ctg gtc cgc gee ctg 1008 
Asp Trp Leu Tyr Pro Thr Ala Glu Asn Arg His Leu Val Arg Ala Leu 
325 330 335 

acc gee gee ggg gee cgc gcg gee ttc gee gag ate gag age gac aag 1056 
Thr Ala Ala Gly Ala Arg Ala Ala Phe Ala Glu lie Glu Ser Asp Lys 
340 345 350 

ggc cat gac gee ttc ctg ctg gac gag ccg gtg atg gac gee gcg ctg 1104 
Gly His Asp Ala Phe Leu Leu Asp Glu Pro Val Met Asp Ala Ala Leu 
355 360 365 




gaa ggc ttc ctg gee teg gee gaa cgc gat egg ggg ctg gtt 1146 
u Gly Phe Leu Ala Ser Ala Glu Arg Asp Arg Gly Leu Val 
370 375 380 



ga 114 9 



<210> 10 
<211> 382 
<212> PRT 

<213> Caulobacter crescentus 
<400> 10 

Met Ala Ala Leu Asp Pro lie Thr Pro Ala Gly Gly Gly Thr Trp Arg 
1 5 10 15 

Phe Pro Ala Asn Glu Pro Leu Arg Leu Asp Ser Gly Gly Val lie Glu 
20 25 30 

Gly Leu Glu lie Ala Tyr Gin Thr Tyr Gly Gin Leu Asn Ala Asp Lys 
35 40 45 

Ser Asn Ala Val Leu lie Cys His Ala Leu Thr Gly Asp Gin His Val 
50 55 60 



M/43127 



MetA 




15 



Ala Ser Pro His Pro Thr Thr Gly Lys Pro Gly Trp Trp Gin Arg Leu 
65 70 75 80 

Val Gly Pro Gly Lys Pro Leu Asp Pro Ala Arg His Phe lie lie Cys 
85 90 95 

Ser Asn Val lie Gly Gly Cys Met Gly Ser Thr Gly Pro Ala Ser lie 
100 105 110 

Asn Pro Ala Thr Gly Lys Thr Tyr Gly Leu Ser Phe Pro Val He Thr 
115 120 125 

He Ala Asp Met Val Arg Ala Gin Ala Met Leu Val Ser Ala Leu Gly 
130 135 140 

Val Glu Thr Leu Phe Ala Val Val Gly Gly Ser Met Gly Gly Met Gin 
145 150 155 160 

Val Gin Gin Trp Ala Val Asp Tyr Pro Glu Arg Met Phe Ser Ala Val 
165 170 175 

al Leu Ala Ser Ala Ser Arg His Ser Ala Gin Asn He Ala Phe His 
180 185 190 

Glu Val Gly Arg Gin Ala He Met Ala Asp Pro Asp Trp Arg Gly Gly 
195 200 205 

Ala Tyr Ala Glu His Gly Val Arg Pro Glu Lys Gly Leu Ala Val Ala 
210 215 220 

Arg Met Ala Ala His He Thr Tyr Leu Ser Glu Pro Ala Leu Gin Arg 
225 230 235 240 

Lys Phe Gly Arg Glu Leu Gin Arg Asp Gly Leu Ser Trp Gly Phe Asp 
245 250 255 

Ala Asp Phe Gin Val Glu Ser Tyr Leu Arg His Gin Gly Ser Ser Phe 
260 265 270 



,al Asp Arg Phe Asp Ala Asn Ser Tyr Leu Tyr He Thr Arg Ala Met 
275 280 285 



p Tyr Phe Asp He Ala Ala Ser His Gly Gly Val Leu Ala Lys Ala 

290 295 300 

Phe Thr Arg Ala Arg Asn Val Arg Phe Cys Val Leu Ser Phe Ser Ser 
305 310 315 320 

Asp Trp Leu Tyr Pro Thr Ala Glu Asn Arg His Leu Val Arg Ala Leu 
325 330 335 

Thr Ala Ala Gly Ala Arg Ala Ala Phe Ala Glu He Glu Ser Asp Lys 
340 345 350 

Gly His Asp Ala Phe Leu Leu Asp Glu Pro Val Met Asp Ala Ala Leu 
355 360 365 

Glu Gly Phe Leu Ala Ser Ala Glu Arg Asp Arg Gly Leu Val 

370 375 380 



<210> 11 
M/43127 



MetA 



<211> 1140 
<212> DNA 

<213> Neisseria gonorrhoeae 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> RNG00132 

<400> 11 

atg agt caa aat acc teg gtg ggc att gta acg ccc caa aaa att ccg 
Met Ser Gin Asn Thr Ser Val Gly lie Val Thr Pro Gin Lys lie Pro 
15 10 15 

ttt gaa atg ccg ctg gtt ttg gaa aac ggt aaa act ttg ccg cgt ttc 
Phe Glu Met Pro Leu Val Leu Glu Asn Gly Lys Thr Leu Pro Arg Phe 
20 25 30 




gat ctg atg att gaa acc tac ggc gag ctg aat get gaa aaa aac aat 
Asp Leu Met lie Glu Thr Tyr Gly Glu Leu Asn Ala Glu Lys Asn Asn 
35 40 45 

r cg gtt tta ate tgc cac gcg ctg teg ggc aac cat cac gtt gcg ggc 
Ala Val Leu lie Cys His Ala Leu Ser Gly Asn His His Val Ala Gly 
50 55 60 



agg cat teg gcg gag gat aaa tat acg ggc tgg tgg gac aat atg gtc 

Arg His Ser Ala Glu Asp Lys Tyr Thr Gly Trp Trp Asp Asn Met Val 

65 70 75 80 

ggt ccc gga aaa ccg att gat acg gaa cgt ttt ttc gtg gtc ggg ttg 

Gly Pro Gly Lys Pro He Asp Thr Glu Arg Phe Phe Val Val Gly Leu 
85 90 95 

aac aat ctg ggc ggc tgc gac ggc age age ggg cct ttg teg ate aat 

Asn Asn Leu Gly Gly Cys Asp Gly Ser Ser Gly Pro Leu Ser He Asn 

100 105 110 



cct gaa acg ggc agg gaa tac ggc gcg gat ttt ccg atg gtt acg gtg 
Pro Glu Thr Gly Arg Glu Tyr Gly Ala Asp Phe Pro Met Val Thr Val 
115 120 125 



g gac tgg gta aaa tea caa gec gcg ctt gee gat tat etc ggc ate 
lys Asp Trp Val Lys Ser Gin Ala Ala Leu Ala Asp Tyr Leu Gly He 
130 135 140 



gaa caa tgg gcg gcg gtt gtc ggc ggc age ttg ggc ggc atg cag get 
Glu Gin Trp Ala Ala Val Val Gly Gly Ser Leu Gly Gly Met Gin Ala 
145 150 155 ' 160 

ttg cag tgg gcg att tec tat ccc gaa cgt gtg cgc cac gee ttg gtg 
Leu Gin Trp Ala He Ser Tyr Pro Glu Arg Val Arg His Ala Leu Val 
165 170 175 

att gcg tct gcg ccg aaa ctg tec gcg caa aat ate gcg ttt aat gat 
He Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala Phe Asn Asp 
180 185 190 

gta gca cgt cag gcg att ttg acc gac ccc gat ttc aat gaa gga cat 
Val Ala Arg Gin Ala He Leu Thr Asp Pro Asp Phe Asn Glu Gly His 
195 200 205 

tac cgc age cac aac acc gtt ccc gcg cgc ggt ttg egg att gee cgt 

M/43127 



96 

144 

192 

240 

288 

336 

384 

432 

480 

528 

576 

624 

672 

MetA 



• 



17 



Tyr Arg Ser His Asn Thr Val Pro Ala Arg Gly Leu Arg lie Ala Arg 
210 215 220 

atg atg gga cac att acg tat ctt gcc gaa gac ggt ttg ggc aaa aaa 720 

Met Met Gly His lie Thr Tyr Leu Ala Glu Asp Gly Leu Gly Lys Lys 
225 230 235 240 

ttc gga cgc gat ttg cgt tec aac ggc tat caa tac ggc tat age gtt 768 

Phe Gly Arg Asp Leu Arg Ser Asn Gly Tyr Gin Tyr Gly Tyr Ser Val 

245 250 255 

gaa ttt gaa gta gaa tec tat etc cgc tat caa ggc gac aaa ttc gtc 816 

Glu Phe Glu Val Glu Ser Tyr Leu Arg Tyr Gin Gly Asp Lys Phe Val 
260 265 270 

ggg egg ttt gat get aat aca tat ttg ctg atg acc aaa get ttg gac 864 

Gly Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr Lys Ala Leu Asp 
275 280 285 



tat ttc gat ccg gcg gcg gat ttc ggc aac age ctg acc cgc gcc gtg 912 
Phe Asp Pro Ala Ala Asp Phe Gly Asn Ser Leu Thr Arg Ala Val 
290 295 300 




cag gat gtg cag gca aaa ttc ttt gtc gcc age ttc age acc gac tgg 960 
Gin Asp Val Gin Ala Lys Phe Phe Val Ala Ser Phe Ser Thr Asp Trp 
305 310 315 320 

cgt ttc gcg ccc gaa cgt teg cac gaa ctg gtc aag gca ctg att gcc 1008 
Arg Phe Ala Pro Glu Arg Ser His Glu Leu Val Lys Ala Leu lie Ala 
325 330 335 

gcc caa aaa tec gtg cag tat ate gaa gtc aag tec gca cac ggg cac 1056 
Ala Gin Lys Ser Val Gin Tyr lie Glu Val Lys Ser Ala His Gly His 
340 345 350 

gat gcc ttt tta atg gaa gac gaa gcc tat atg cgc gcc gta acg get 1104 
Asp Ala Phe Leu Met Glu Asp Glu Ala Tyr Met Arg Ala Val Thr Ala 
355 360 365 

tat atg aac aat gtt gac aag gat tgc cga tta tga 1140 
r Met Asn Asn Val Asp Lys Asp Cys Arg Leu 
370 375 



<210> 12 
<211> 379 
<212> PRT 

<213> Neisseria gonorrhoeae 



<400> 12 

Met Ser Gin Asn Thr Ser Val Gly He Val Thr Pro Gin Lys He Pro 
15 10 15 

Phe Glu Met Pro Leu Val Leu Glu Asn Gly Lys Thr Leu Pro Arg Phe 
20 25 30 

Asp Leu Met He Glu Thr Tyr Gly Glu Leu Asn Ala Glu Lys Asn Asn 
35 40 45 

Ala Val Leu He Cys His Ala Leu Ser Gly Asn His His Val Ala Gly 
50 55 60 



M/43127 



MetA 



• 



18 



Arg His Ser Ala Glu Asp Lys Tyr Thr Gly Trp Trp Asp Asn Met Val 
65 70 ' 75 80 

Gly Pro Gly Lys Pro lie Asp Thr Glu Arg Phe Phe Val Val Gly Leu 
85 90 95 

Asn Asn Leu Gly Gly Cys Asp Gly Ser Ser Gly Pro Leu Ser lie Asn 
100 105 110 

Pro Glu Thr Gly Arg Glu Tyr Gly Ala Asp Phe Pro Met Val Thr Val 
115 120 125 

Lys Asp Trp Val Lys Ser Gin Ala Ala Leu Ala Asp Tyr Leu Gly lie 
130 135 140 

Glu Gin Trp Ala Ala Val Val Gly Gly Ser Leu Gly Gly Met Gin Ala 
145 150 155 160 

Leu Gin Trp Ala He Ser Tyr Pro Glu Arg Val Arg His Ala Leu Val 
165 170 175 

e Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala Phe Asn Asp 
180 185 190 

Val Ala Arg Gin Ala He Leu Thr Asp Pro Asp Phe Asn Glu Gly His 
195 200 205 

Tyr Arg Ser His Asn Thr Val Pro Ala Arg Gly Leu Arg He Ala Arg 
210 215 220 

Met Met Gly His He Thr Tyr Leu Ala Glu Asp Gly Leu Gly Lys Lys 
225 230 235 240 

Phe Gly Arg Asp Leu Arg Ser Asn Gly Tyr Gin Tyr Gly Tyr Ser Val 
245 250 255 

Glu Phe Glu Val Glu Ser Tyr Leu Arg Tyr Gin Gly Asp Lys Phe Val 
260 265 270 

Gly Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr Lys Ala Leu Asp 
275 280 285 




• 



Phe Asp Pro Ala Ala Asp Phe Gly Asn Ser Leu Thr Arg Ala Val 
290 295 300 



Gin Asp Val Gin Ala Lys Phe Phe Val Ala Ser Phe Ser Thr Asp Trp 
305 310 315 320 

Arg Phe Ala Pro Glu Arg J3er His Glu Leu Val Lys Ala Leu He Ala 
325 330 335 

Ala Gin Lys Ser Val Gin Tyr He Glu Val Lys Ser Ala His Gly His 
340 345 350 

Asp Ala Phe Leu Met Glu Asp Glu Ala Tyr Met Arg Ala Val Thr Ala 
355 360 365 

Tyr Met Asn Asn Val Asp Lys Asp Cys Arg Leu 
370 375 



<210> 13 
<211> 1140 



M/43127 



MetA 



19 



<212> DNA 

<213> Neisseria meningitidis ser. A 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> RNM00815 

<400> 13 

atg agt caa aat gcc teg gtg ggc att gta acg ccc caa aaa att ccg 48 
Met Ser Gin Asn Ala Ser Val Gly lie Val Thr Pro Gin Lys lie Pro 
15 10 15 

ttt gaa atg ccg ctg gtt ttg gaa aac ggt aaa act ttg ccg cgt ttc 96 
Phe Glu Met Pro Leu Val Leu Glu Asn Gly Lys Thr Leu Pro Arg Phe 
20 25 30 

gat ctg atg att gaa acc tac ggc gag ctg aat gcc gaa aaa aat aat 144 
Asp Leu Met lie Glu Thr Tyr Gly Glu Leu Asn Ala Glu Lys Asn Asn 
35 40 45 




g gtt tta ate tgt cat gcg ctg tea ggc aac cat cat gtt gcg ggc 192 
la Val Leu lie Cys His Ala Leu Ser Gly Asn His His Val Ala Gly 
50 55 60 

agg cat teg gcg gag gat aaa tat acg ggc tgg tgg gac aat atg gta 24 0 
Arg His Ser Ala Glu Asp Lys Tyr Thr Gly Trp Trp Asp Asn Met Val 
65 70 75 80 

gga ccc ggc aaa ccg att gat aca gaa cgt ttt ttc gtg gtc ggt ttg 288 
Gly Pro Gly Lys Pro lie Asp Thr Glu Arg Phe Phe Val Val Gly Leu 
85 90 95 

aac aat ctg ggc ggc tgc gac ggc age age gga cct ttg teg ate aat 33 6 
Asn Asn Leu Gly Gly Cys Asp Gly Ser Ser Gly Pro Leu Ser lie Asn 
100 105 110 

cct gaa acg ggc agg gaa tac ggc gcg gat ttt ccg gtg gtt acg gtg 384 
Pro Glu Thr Gly Arg Glu Tyr Gly Ala Asp Phe Pro Val Val Thr Val 
115 120 125 

g gac tgg gta aaa tec caa gcc gcg ctt acc gat tat etc ggc ate 432 
s Asp Trp Val Lys Ser Gin Ala Ala Leu Thr Asp Tyr Leu Gly lie 
130 135 140 

ggg caa tgg gcg gcg gtt gtc ggc ggc age ttg ggc ggt atg cag get 480 
Gly Gin Trp Ala Ala Val Val Gly Gly Ser Leu Gly Gly Met Gin Ala 
145 150 ~ 155 160 

ttg cag tgg acg att tec tat ccc gag cgc gtg cgc cat gcc tta gtg 52 8 
Leu Gin Trp Thr lie Ser Tyr Pro Glu Arg Val Arg His Ala Leu Val 
165 170 175 

att gcg tec gcg ccg aaa ctg tec acg caa aat ate gcg ttt aat gat 576 
He Ala Ser Ala Pro Lys Leu Ser Thr Gin Asn He Ala Phe Asn Asp 
180 185 190 

gta gca cgt cag gcg att ttg acc gat ccc gat ttc aac gaa gga cat 624 
Val Ala Arg Gin Ala He Leu Thr Asp Pro Asp Phe Asn Glu Gly His 
195 200 ~ 205 

tac cgc age cgc aac acc gtt ccc get egg ggc ttg egg att gcc cgc 672 
Tyr Arg Ser Arg Asn Thr Val Pro Ala Arg Gly Leu Arg He Ala Arg 
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210 



215 



220 



atg 
Met 
225 


atg 
Met 


ggg 

Gly 


cac 
His 


ate 
He 


acc 
Thr 
230 


tat 
Tyr 


ctt 
Leu 


gcc 
Ala 


gaa 
Glu 


gac 
Asp 
235 


ggt 

Gly 


ttg 
Leu 


ggc 

Gly 


aaa 
Lys 


aaa 
Lys 
240 


720 


ttc 
Phe 


gga 
Gly 


cgc 
Arg 


gat 
Asp 


ttg 
Leu 
245 


cgt 
Arg 


tec 
Ser 


aac 
Asn 


ggc tat 
Gly Tyr 
250 


caa 
Gin 


tac 
Tyr 


ggc 
Gly 


tat 
Tyr 


ggc 
Gly 
255 


gtt 
Val 


768 


gaa 
Glu 


ttt 
Phe 


gaa 
Glu 


gta 
Val 
260 


gaa 
Glu 


tec tat ctg 
Ser Tyr Leu 


cgc 
Arg 
265 


tat 
Tyr 


caa 
Gin 


ggc 
Gly 


gat 
Asp 


aaa 
Lys 
270 


ttc 
Phe 


gtc 
val 


816 


ggg 

Gly 


egg 
Arg 


ttt 
Phe 
275 


gat 
Asp 


gcc 
Ala 


aac 
Asn 


acc 
Thr 


tat 
Tyr 
280 


ttg 
Leu 


ctg 
Leu 


atg 
Met 


acc 
Thr 


aag 
Lys 
285 


get 
Ala 


ttg 
Leu 


gac 
Asp 


864 


tat 


ttc 
Phe 
290 


gat 
Asp 


ccg gcg gcg gat 
Pro Ala Ala Asp 
295 


ttc 
Phe 


ggc aac 
Gly Asn 


age 
Ser 


ctg 
Leu 
300 


ace 
Thr 


cgc 
Arg 


gcc 
Ala 


gtg 
Val 


912 


Gin 
305 


gat 
Asp 


gtt 

Val 


cag 
Gin 


gca 
Ala 


aaa 
Lys 
310 


ttc 
Phe 


ttt 
Phe 


gtc 
Val 


gcc 
Ala 


age 
Ser 
315 


ttc 
Phe 


age 
Ser 


acc 
Thr 


gat 
Asp 


tgg 

Trp 
320 


960 


cgt 
Arg 


ttc 
Phe 


gcg 
Ala 


ccc 
Pro 


gaa 
Glu 
325 


cgt 
Arg 


teg 
Ser 


cac 
His 


gaa 
Glu 


ctg 
Leu 
330 


gtc 
Val 


aag 
Lys 


gcc 
Ala 


ctg 
Leu 


att 
He 
335 


gcc 
Ala 


1008 


gcc 

Hid 


caa 

(11 n 


aaa 
Lys 


tec 
Ser 
340 


gtg 
Val 


cag tat 
Gin Tyr 


ate 
He 


gaa 
Glu 
345 


gtc 
Val 


aaa 
Lys 


tec 
Ser 


gca 

A±Si 


cac 

TT-5 o 
XlX S 

350 


ggg 

uiy 


cac 

XT A a 


1056 


gat 
Asp 


gcc 
Ala 


ttt 
Phe 
355 


tta 
Leu 


atg 
Met 


gaa 
Glu 


gac 
Asp 


gaa 
Glu 
360 


gcc 
Ala 


tat 
Tyr 


atg 
Met 


cgt 
Arg 


gcg 
Ala 
365 


gtc 
Val 


gcc 
Ala 


gcc 
Ala 


1104 


tat 
Tyr 


atg 
Met 


aac 
Asn 


aac 
Asn 


gtt 
Val 


tat 
Tyr 


aag 
Lys 


gaa 
Glu 


tgt 
Cys 


cag 
Gin 


caa 
Gin 


tga 










1140 




370 



375 



^210> 14 
<211> 379 
<212> PRT 

<213> Neisseria meningitidis ser. A 



<400> 14 

Met Ser Gin Asn Ala Ser Val Gly He Val Thr Pro Gin Lys He Pro 
15 10 15 

Phe Glu Met Pro Leu Val Leu Glu Asn Gly Lys Thr Leu Pro Arg Phe 
20 25 30 

Asp Leu Met He Glu Thr Tyr Gly Glu Leu Asn Ala Glu Lys Asn Asn 
35 40 45 

Ala Val Leu He Cys His Ala Leu Ser Gly Asn His His Val Ala Gly 
50 55 60 

Arg His Ser Ala Glu Asp Lys Tyr Thr Gly Trp Trp Asp Asn Met Val 
65 70 75 80 



M/43127 



MetA 




Gly Pro Gly Lys Pro lie Asp Thr Glu Arg Phe Phe Val Val Gly Leu 
85 90 95 

Asn Asn Leu Gly Gly Cys Asp Gly Ser Ser Gly Pro Leu Ser He Asn 
100 105 110 

Pro Glu Thr Gly Arg Glu Tyr Gly Ala Asp Phe Pro Val Val Thr Val 
115 120 125 

Lys Asp Trp Val Lys Ser Gin Ala Ala Leu Thr Asp Tyr Leu Gly He 
13 0 135 14 0 

Gly Gin Trp Ala Ala Val Val Gly Gly Ser Leu Gly Gly Met Gin Ala 
145 150 155 160 

Leu Gin Trp Thr He Ser Tyr Pro Glu Arg Val Arg His Ala Leu Val 
165 170 175 

lie Ala Ser Ala Pro Lys Leu Ser Thr Gin Asn He Ala Phe Asn Asp 
180 185 190 

al Ala Arg Gin Ala He Leu Thr Asp Pro Asp Phe Asn Glu Gly His 
195 200 205 

Tyr Arg Ser Arg Asn Thr Val Pro Ala Arg Gly Leu Arg He Ala Arg 
210 215 220 

Met Met Gly His He Thr Tyr Leu Ala Glu Asp Gly Leu Gly Lys Lys 
225 230 235 " 240 

Phe Gly Arg Asp Leu Arg Ser Asn Gly Tyr Gin Tyr Gly Tyr Gly Val 
245 250 " 255 

Glu Phe Glu Val Glu Ser Tyr Leu Arg Tyr Gin Gly Asp Lys Phe Val 
260 265 " 270 

Gly Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr Lys Ala Leu Asp 
275 280 285 

r Phe Asp Pro Ala Ala Asp Phe Gly Asn Ser Leu Thr Arg Ala Val 
290 295 300 

n Asp Val Gin Ala Lys Phe Phe Val Ala Ser Phe Ser Thr Asp Trp 
305 310 315 320 

Arg Phe Ala Pro Glu Arg Ser His Glu Leu Val Lys Ala Leu He Ala 
325 330 335 

Ala Gin Lys Ser Val Gin Tyr He Glu Val Lys Ser Ala His Gly His 
340 345 350 

Asp Ala Phe Leu Met Glu Asp Glu Ala Tyr Met Arg Ala Val Ala Ala 
355 360 365 

Tyr Met Asn Asn Val Tyr Lys Glu Cys Gin Gin 
370 375 




<210> 15 
<211> 1140 
<212> DNA 

<213> Pseudomonas fluorescens 



M/43127 



MetA 



22 



<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> RPU01633 

<400> 15 

atg cca get gec ttt ccc ccc gat tct gtt ggt ctg gtg acg ccg caa 4 8 

Met Pro Ala Ala Phe Pro Pro Asp Ser Val Gly Leu Val Thr Pro Gin 

1 5 10 15 

acg gcg cac ttc age gaa ccg ctg gec ctg gec tgc ggc cgt teg ctg 96 
Thr Ala His Phe Ser Glu Pro Leu Ala Leu Ala Cys Gly Arg Ser Leu 
20 25 30 

gec gat tat gac ctg ate tac gaa ace tac ggc acg ctg aac gcg caa 144 
Ala Asp Tyr Asp Leu lie Tyr Glu Thr Tyr Gly Thr Leu Asn Ala Gin 
35 40 45 



• 



gcg age aac gec gtg ctg ate tgc cac gee ttg tec ggc cac cac cat 192 
a Ser Asn Ala Val Leu lie Cys His Ala Leu Ser Gly His His His 
50 • 55 60 



get gcg ggt tat cac age gtc gac gac cgc aag ccc ggt tgg tgg gac 240 
Ala Ala Gly Tyr His Ser Val Asp Asp Arg Lys Pro Gly Trp Trp Asp 
65 70 75 80 

age tgc ate ggc ccc ggc aaa ccg ate gac ace aac aag ttc ttc gtg 2 88 
Ser Cys lie Gly Pro Gly Lys Pro lie Asp Thr Asn Lys Phe Phe Val 
85 90 95 

gtc age ctg aac aac etc ggc ggt tgc aat ggt tct ace ggc ccg age 336 
Val Ser Leu Asn Asn Leu Gly Gly Cys Asn Gly Ser Thr Gly Pro Ser 
100 105 110 

age etc aat ccg gaa ace ggc aag ccg ttc ggc gee gac ttc ccg gtg 3 84 
Ser Leu Asn Pro Glu Thr Gly Lys Pro Phe Gly Ala Asp Phe Pro Val 
115 120 125 



• 



ctg ace gtg gaa gac tgg gtg cac age cag gca cgc ctg gee gac ctg 432 
eu Thr Val Glu Asp Trp Val His Ser Gin Ala Arg Leu Ala Asp Leu 
130 135 140 



tc ggc ate ggc cag tgg gcg gcg gtg ate ggc ggc age ctg ggc ggc 480 
Leu Gly lie Gly Gin Trp Ala Ala Val lie Gly Gly Ser Leu Gly Gly 
145 150 155 160 

atg cag gcg ctg caa tgg ace ate acc tat ccg gat cgc gtt cgc cac 52 8 
Met Gin Ala Leu Gin Trp Thr He Thr Tyr Pro Asp Arg Val Arg His 
165 170 175 

tgc ctg gee ate gee teg gee ccc aag ctg teg gcg cag aac ate gec 576 
Cys Leu Ala He Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala 
180 185 190 

ttc aac gaa gtg gcg cgc cag gcg ate etc act gac ccg gaa ttc cac 624 
Phe Asn Glu Val Ala Arg Gin Ala He Leu Thr Asp Pro Glu Phe His 
195 200 205 

ggc ggc teg ttc cag gaa cac ggc gtg ate ccc aag cgc ggc ctg atg 672 
Gly Gly Ser Phe Gin Glu His Gly Val He Pro Lys Arg Gly Leu Met 
210 215 220 
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ctg gcg egg atg gtg ggg cac ate acc tac ctg tec gac gac tec atg 720 

Leu Ala Arg Met Val Gly His lie Thr Tyr Leu Ser Asp Asp Ser Met 

225 230 235 240 

ggt gag aaa ttc ggc cgt ggc ctg aag age gaa aag etc aac tac gac 768 

Gly Glu Lys Phe Gly Arg Gly Leu Lys Ser Glu Lys Leu Asn Tyr Asp 
245 250 255 

ttc cac age gtc gag ttc cag gtc gaa age tac ctg cgc tat cag ggc 816 

Phe His Ser Val Glu Phe Gin Val Glu Ser Tyr Leu Arg Tyr Gin Gly 
260 265 270 

gaa gag ttc tec ggg cgc ttc gat gee aac acc tat ctg ttg atg acc 864 

Glu Glu Phe Ser Gly Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr 
275 280 285 

aag gcg ctg gac tac ttc gat ccg gcg gcg aac ttc aac gat aac ctg 912 

Lys Ala Leu Asp Tyr Phe Asp Pro Ala Ala Asn Phe Asn Asp Asn Leu 

290 295 300 

g aaa acc ttc gaa ggt gca aaa gec aag ttc tgc gtg atg teg ttc 960 

a Lys Thr Phe Glu Gly Ala Lys Ala Lys Phe Cys Val Met Ser Phe 

5 310 315 320 

acc acc gac tgg cgc ttc tec ccg gee cgc teg cga gaa ctg gtg gat 1008 

Thr Thr Asp Trp Arg Phe Ser Pro Ala Arg Ser Arg Glu Leu Val Asp 
325 330 335 

gcg ctg atg gcg gcg cgc aaa gac gtc age tac ctg gaa ate gac gcg 1056 

Ala Leu Met Ala Ala Arg Lys Asp Val Ser Tyr Leu Glu lie Asp Ala 
340 345 350 

ccc cag ggc cac gac gec ttc ctg att ccg ate ccg cgc tac ttg cag 1104 

Pro Gin Gly His Asp Ala Phe Leu lie Pro He Pro Arg Tyr Leu Gin 
355 360 365 

gcg ttc ggc aat tac atg aac cgc att acg ttg tga 1140 
Ala Phe Gly Asn Tyr Met Asn Arg He Thr Leu 
370 375 



0> 16 
1> 379 
12 > PRT 

<213> Pseudomonas fluorescens 



<400> 16 

Met Pro Ala Ala Phe Pro Pro Asp Ser Val Gly Leu Val Thr Pro Gin 
15 10 15 

Thr Ala His Phe Ser Glu Pro Leu Ala Leu Ala Cys Gly Arg Ser Leu 
20 25 30 

Ala Asp Tyr Asp Leu He Tyr Glu Thr Tyr Gly Thr Leu Asn Ala Gin 
35 40 45 

Ala Ser Asn Ala Val Leu He Cys His Ala Leu Ser Gly His His His 
50 55 60 

Ala Ala Gly Tyr His Ser Val Asp Asp Arg Lys Pro Gly Trp Trp Asp 
65 70 75 80 



Ser Cys He Gly Pro Gly Lys Pro He Asp Thr Asn Lys Phe Phe Val 
M/43127 
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85 90 95 

Val Ser Leu Asn Asn Leu Gly Gly Cys Asn Gly Ser Thr Gly Pro Ser 

100 105 110 

Ser Leu Asn Pro Glu Thr Gly Lys Pro Phe Gly Ala Asp Phe Pro Val 

115 * 120 125 

Leu Thr Val Glu Asp Trp Val His Ser Gin Ala Arg Leu Ala Asp Leu 

130 135 140 

Leu Gly lie Gly Gin Trp Ala Ala Val lie Gly Gly Ser Leu Gly Gly 

145 ~ 150 155 160 

Met Gin Ala Leu Gin Trp Thr lie Thr Tyr Pro Asp Arg Val Arg His 

165 170 175 



Cys Leu Ala He Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala 
180 185 190 



e Asn Glu Val Ala Arg Qln Ala He Leu Thr Asp Pro Glu Phe His 
195 200 205 




Gly Gly Ser Phe Gin Glu His Gly Val He Pro Lys Arg Gly Leu Met 
210 215 220 

Leu Ala Arg Met Val Gly His He Thr Tyr Leu Ser Asp Asp Ser Met 
225 230 235 240 

Gly Glu Lys Phe Gly Arg Gly Leu Lys Ser Glu Lys Leu Asn Tyr Asp 
245 250 255 

Phe His Ser Val Glu Phe Gin Val Glu Ser Tyr Leu Arg Tyr Gin Gly 
260 265 270 

Glu Glu Phe Ser Gly Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr 
275 280 285 

Lys Ala Leu Asp Tyr Phe Asp Pro Ala Ala Asn Phe Asn Asp Asn Leu 
290 295 300 

a Lys Thr Phe Glu Gly Ala Lys Ala Lys Phe Cys Val Met Ser Phe 
5 310 315 320 

Thr Thr Asp Trp Arg Phe Ser Pro Ala Arg Ser Arg Glu Leu Val Asp 
325 330 335 

Ala Leu Met Ala Ala Arg Lys Asp Val Ser Tyr Leu Glu He Asp Ala 
340 " 345 350 

Pro Gin Gly His Asp Ala Phe Leu He Pro He Pro Arg Tyr Leu Gin 
355 360 365 

Ala Phe Gly Asn Tyr Met Asn Arg He Thr Leu 
370 375 



<210> 17 
<211> 1140 
<212> DNA 

<213> Pseudomonas aeruginosa 
<220> 
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<222> (1) . . (1137) 

<223> RPA04460 




<400> 17 

atg ccc aca gtc ttc ccc gac gac tec gtc ggt ctg gtc tec ccc cag 48 
Met Pro Thr Val Phe Pro Asp Asp Ser Val Gly Leu Val Ser Pro Gin 
15 10 15 

acg ctg cac ttc aac gaa ccg etc gag ctg ace age ggc aag tec ctg 96 
Thr Leu His Phe Asn Glu Pro Leu Glu Leu Thr Ser Gly Lys Ser Leu 
20 25 30 

gee gag tac gac ctg gtg ate gaa ace tac ggc gag ctg aat gee acg 144 
Ala Glu Tyr Asp Leu Val lie Glu Thr Tyr Gly Glu Leu Asn Ala Thr 
35 40 45 

cag age aac gcg gtg ctg ate tgc cac gee etc tec ggc cac cac cac 192 
Gin Ser Asn Ala Val Leu lie Cys His Ala Leu Ser Gly His His His 
50 55 60 

c gee ggc tac cac age gtc gac gag cgc aag ccg ggc tgg tgg gac 240 
a Ala Gly Tyr His Ser Val Asp Glu Arg Lys Pro Gly Trp Trp Asp 
65 70 75 80 

age tgc ate ggt ccg ggc aag ccg ate gac acc cgc aag ttc ttc gtc 2 88 
Ser Cys lie Gly Pro Gly Lys Pro lie Asp Thr Arg Lys Phe Phe Val 
85 90 95 

gtc gee etc aac aac etc ggc ggt tgc aac gga tec age ggc ccc gee 336 
Val Ala Leu Asn Asn Leu Gly Gly Cys Asn Gly Ser Ser Gly Pro Ala 
100 105 110 

age ate aat ccg gcg acc ggc aag gtc tac ggc gcg gac ttc ccg atg 3 84 
Ser lie Asn Pro Ala Thr Gly Lys Val Tyr Gly Ala Asp Phe Pro Met 
115 120 125 

gtt acg gtg gaa gac tgg gtg cat age cag gcg cgc ctg gca gac cgc 432 
Val Thr Val Glu Asp Trp Val His Ser Gin Ala Arg Leu Ala Asp Arg 
130 135 140 



m 



c ggc ate cgc cag tgg gee gcg gtg gtc ggc ggc age etc ggc ggc 4 80 
!u Gly lie Arg Gin Trp Ala Ala Val Val Gly Gly Ser Leu Gly Gly 
45 150 155 160 



atg cag gcg ctg caa tgg acc ate age tat ccc gag cgc gtc cgt cac 52 8 

Met Gin Ala Leu Gin Trp Thr lie Ser Tyr Pro Glu Arg Val Arg His 

165 170 175 

tgc ctg tgc ate gec age gcg ccg aag ctg teg gcg cag aac ate gec 576 

Cys Leu Cys lie Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn lie Ala 
180 185 190 

ttc aac gaa gtc gee egg cag gcg att ctt tec gac cct gag ttc etc 624 

Phe Asn Glu Val Ala Arg Gin Ala lie Leu Ser Asp Pro Glu Phe Leu 
195 200 205 

93C tac ttc cag gag cag ggc gtg att ccc aag cgc ggc etc aag 672 

Gly Gly Tyr Phe Gin Glu Gin Gly Val lie Pro Lys Arg Gly Leu Lys 
210 215 220 

ctg gcg egg atg gtc ggc cat ate acc tac ctg tec gac gac gec atg 72 0 

Leu Ala Arg Met Val Gly His lie Thr Tyr Leu Ser Asp Asp Ala Met 
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225 230 235 240 

ggc gcc aag ttc ggc cgt gta ctg aag acc gag aag etc aac tac gac 768 
Gly Ala Lys Phe Gly Arg Val Leu Lys Thr Glu Lys Leu Asn Tyr Asp 
245 250 255 

ctg cac age gtc gag ttc cag gtc gag agt tac ctg cgc tac cag ggc 816 
Leu His Ser Val Glu Phe Gin Val Glu Ser Tyr Leu Arg Tyr Gin Gly 
260 265 270 

gag gag ttc tec acc cgc ttc gac gcc aat acc tac ctg ctg atg acc 864 
Glu Glu Phe Ser Thr Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr 
275 280 285 

aag gcg ctg gac tac ttc gac ccc gcc gcc gcc cac ggc gac gac ctg 912 
Lys Ala Leu Asp Tyr Phe Asp Pro Ala Ala Ala His Gly Asp Asp Leu 
290 295 300 

gtg cgc acc ctg gag ggc gtc gag gcg gac ttc tgc ctg atg tec ttc 960 
Val Arg Thr Leu Glu Gly Val Glu Ala Asp Phe Cys Leu Met Ser Phe 
* £>5 310 315 320 

cc acc gac tgg cgt ttc teg ccg gcc cgc teg egg gaa ate gtc gac 100 8 
Thr Thr Asp Trp Arg Phe Ser Pro Ala Arg Ser Arg Glu lie Val Asp 
325 330 335 

gcc ctg ate gcg gcg aaa aag aac gtc age tac ctg gag ate gac gcc 1056 
Ala Leu lie Ala Ala Lys Lys Asn Val Ser Tyr Leu Glu lie Asp Ala 
340 345 350 

ccg caa ggc cac gac gcc ttc etc atg ccg ate ccc egg tac ctg caa 1104 
Pro Gin Gly His Asp Ala Phe Leu Met Pro lie Pro Arg Tyr Leu Gin 
355 360 365 

gcc ttc age ggt tac atg aac cgc ate age gtg tga 1140 
Ala Phe Ser Gly Tyr Met Asn Arg lie Ser Val 
370 375 




<210> 18 
211> 379 
12 > PRT 

13 > Pseudomonas aeruginosa 
<400> 18 

Met Pro Thr Val Phe Pro Asp Asp Ser Val Gly Leu Val Ser Pro Gin 
15 10 15 

Thr Leu His Phe Asn Glu Pro Leu Glu Leu Thr Ser Gly Lys Ser Leu 
20 25 30 

Ala Glu Tyr Asp Leu Val lie Glu Thr Tyr Gly Glu Leu Asn Ala Thr 
35 40 45 

Gin Ser Asn Ala Val Leu lie Cys His Ala Leu Ser Gly His His His 
50 55 60 

Ala Ala Gly Tyr His Ser Val Asp Glu Arg Lys Pro Gly Trp Trp Asp 
65 70 75 80 

Ser Cys lie Gly Pro Gly Lys Pro lie Asp Thr Arg Lys Phe Phe Val 
85 90 95 
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Val Ala Leu Asn Asn Leu Gly Gly Cys Asn Gly Ser Ser Gly Pro Ala 
100 105 ' 110 

Ser lie Asn Pro Ala Thr Gly Lys Val Tyr Gly Ala Asp Phe Pro Met 
115 120 ~ 125 

Val Thr Val Glu Asp Trp Val His Ser Gin Ala Arg Leu Ala Asp Arg 
130 135 140 

Leu Gly lie Arg Gin Trp Ala Ala Val Val Gly Gly Ser Leu Gly Gly 
145 150 155 160 

Met Gin Ala Leu Gin Trp Thr He Ser Tyr Pro Glu Arg Val Arg His 
165 170 175 

Cys Leu Cys He Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala 
180 185 190 

Phe Asn Glu Val Ala Arg Gin Ala He Leu Ser Asp Pro Glu Phe Leu 
195 200 205 

y Gly Tyr Phe Gin Glu Gin Gly Val He Pro Lys Arg Gly Leu Lys 
210 215 220 

Leu Ala Arg Met Val Gly His He Thr Tyr Leu Ser Asp Asp Ala Met 
225 230 235 240 

Gly Ala Lys Phe Gly Arg Val Leu Lys Thr Glu Lys Leu Asn Tyr Asp 
245 250 255 

Leu His Ser Val Glu Phe Gin Val Glu Ser Tyr Leu Arg Tyr Gin Gly 
260 265 270 

Glu Glu Phe Ser Thr Arg Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr 
275 280 285 

Lys Ala Leu Asp Tyr Phe Asp Pro Ala Ala Ala His Gly Asp Asp Leu 
290 295 300 

Val Arg Thr Leu Glu Gly Val Glu Ala Asp Phe Cys Leu Met Ser Phe 
05 310 315 320 

r Thr Asp Trp Arg Phe Ser Pro Ala Arg Ser Arg Glu He Val Asp 
325 330 335 

Ala Leu He Ala Ala Lys Lys Asn Val Ser Tyr Leu Glu He Asp Ala 
340 345 350 

Pro Gin Gly His Asp Ala Phe Leu Met Pro He Pro Arg Tyr Leu Gin 
355 360 365 

Ala Phe Ser Gly Tyr Met Asn Arg He Ser Val 
370 375 



<210> 19 

<211> 1146 

<212> DNA 

<213> Burkholderia cepacia 

<220> 

<221> CDS 

<222> (1) . . (1143) 
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<223> RBU12675 



<400> 19 

atg gaa teg ate ggt ate gtc get ccc caa aaa atg cat ttc acc gag 48 

Met Glu Ser He Gly He Val Ala Pro Gin Lys Met His Phe Thr Glu 
15 10 15 

ccg ctg ccg ttg cag aac ggc agt teg etc gec ggt tac gac ctg atg 96 
Pro Leu Pro Leu Gin Asn Gly Ser Ser Leu Ala Gly Tyr Asp Leu Met 
20 25 30 

gtc gag acc tac ggc acg etc aac gec gcg cgt age aac gcg gtg ctg 144 
Val Glu Thr Tyr Gly Thr Leu Asn Ala Ala Arg Ser Asn Ala Val Leu 
35 40 45 

gtg tgc cac gcg etc aac gcg teg cac cac gtg gcg ggc gtg tat gee 192 
Val Cys His Ala Leu Asn Ala Ser His His Val Ala Gly Val Tyr Ala 
50 . 55 60 



# 



ac aac ccc agg gac ate ggc tgg tgg gac aac atg gtc ggc ccg ggc 24 0 
p Asn Pro Arg Asp He Gly Trp Trp Asp Asn Met Val Gly Pro Gly 
5 70 75 80 




aag ccg etc gac act gac aag ttc ttc gtg ate ggc gtg aac aac etc 288 
Lys Pro Leu Asp Thr Asp Lys Phe Phe Val He Gly Val Asn Asn Leu 
85 90 95 

gga teg tgc ttc ggc teg act ggg ccg atg age ate gat ccg tct acc 336 
Gly Ser Cys Phe Gly Ser Thr Gly Pro Met Ser He Asp Pro Ser Thr 
100 105 110 

ggc aat ccg tac ggc gcg acg ttt ccc gtc gtg acg gtg gaa gac tgg 3 84 
Gly Asn Pro Tyr Gly Ala Thr Phe Pro Val Val Thr Val Glu Asp Trp 
115 120 125 

gtc aac gee cag gcg cgc gtc gcg gat caa ttc ggc ate acg cgc ttt 4 32 
Val Asn Ala Gin Ala Arg Val Ala Asp Gin Phe Gly He Thr Arg Phe 
130 135 140 

gcg gcg gtg atg ggc ggc age etc ggc ggc atg cag gcg etc gcg tgg 4 80 
a Ala Val Met Gly Gly Ser Leu Gly Gly Met Gin Ala Leu Ala Trp 
( 5 150 155 160 

■age atg atg tat ccg gag cgc gtc get cac tgc ate gtg gtc gcg tec 52 8 
Ser Met Met Tyr Pro Glu Arg Val Ala His Cys He Val Val Ala Ser 
165 170 175 

aca ccc aag ctg teg gcg cag aac ate gcg ttc aac gag gtt gcg cgc 576 
Thr Pro Lys Leu Ser Ala Gin Asn He Ala Phe Asn Glu Val Ala Arg 
180 185 190 

teg gcg ate ctg teg gac ccg gac ttc cac ggc ggc aac tac tac gcg 624 
Ser Ala He Leu Ser Asp Pro Asp Phe His Gly Gly Asn Tyr Tyr Ala 
195 200 ' 205 

cac aac gtt aag ccg aag cgc ggc ctg cgc gtc gcg cgc atg ate ggc 672 
His Asn Val Lys Pro Lys Arg Gly Leu Arg Val Ala Arg Met He Gly 
210 215 220 

cac ate acg tat ctg teg gac gac gac atg gee gag aaa ttc ggc cgc 720 
His He Thr Tyr Leu Ser Asp Asp Asp Met Ala Glu Lys Phe Gly Arg 
225 230 235 240 
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teg ctg egg cgc gcg gaa ggc gcg ctg gac gcg tac aac ttc aac ttc 768 

Ser Leu Arg Arg Ala Glu Gly Ala Leu Asp Ala Tyr Asn Phe Asn Phe 

245 250 255 

gac gtg gag ttc gag gtg gag teg tac ctg cgc tac cag ggc gac aag 816 

Asp Val Glu Phe Glu Val Glu Ser Tyr Leu Arg Tyr Gin Gly Asp Lys 

260 265 270 

ttc gec gac tac ttc gac gcg aat acg tat ctg ctg ate ace cgc gcg 864 

Phe Ala Asp Tyr Phe Asp Ala Asn Thr Tyr Leu Leu lie Thr Arg Ala 
275 280 285 

etc gac tac ttc gat ccg gee aag gec ttc gee ggc gac ctg acg gee 912 

Leu Asp Tyr Phe Asp Pro Ala Lys Ala Phe Ala Gly Asp Leu Thr Ala 
290 295 300 

gcg gtc gcg cac acc acg gcg aaa tat ctg ate gec age ttc acg ace 960 

Ala Val Ala His Thr Thr Ala Lys Tyr Leu lie Ala Ser Phe Thr Thr 
305 310 315 320 



c tgg cgc ttc gcg ccg gee cgc teg cgt gaa ctg gtg aag gcg ctg 1008 
p Trp Arg Phe Ala Pro Ala Arg Ser Arg Glu Leu Val Lys Ala Leu 
325 330 335 



etc gat cac aag cgc acg gtc acc tac gcg gaa ate gac gcg ccg cac 1056 
Leu Asp His Lys Arg Thr Val Thr Tyr Ala Glu He Asp Ala Pro His 
340 345 350 

ggc cac gac gee ttc ctg etc gac gac gcg cgc tat cac aac ctg atg 1104 
Gly His Asp Ala Phe Leu Leu Asp Asp Ala Arg Tyr His Asn Leu Met 
355 360 365 

cgc get tac tac gaa cgt att gcg aac gag gtg aac gca tga 1146 
Arg Ala Tyr Tyr Glu Arg He Ala Asn Glu Val Asn Ala 
370 375 380 



^^^^ 



<210> 20 
<211> 381 
<212> PRT 
213> Burkholderia cepacia 



00> 20 

et Glu Ser He Gly He Val Ala Pro Gin Lys Met His Phe Thr Glu 
15 10 15 

Pro Leu Pro Leu Gin Asn Gly Ser Ser Leu Ala Gly Tyr Asp Leu Met 
20 25 30 

Val Glu Thr Tyr Gly Thr Leu Asn Ala Ala Arg Ser Asn Ala Val Leu 
35 40 45 

Val Cys His Ala Leu Asn Ala Ser His His Val Ala Gly Val Tyr Ala 
50 55 60 

Asp Asn Pro Arg Asp He Gly Trp Trp Asp Asn Met Val Gly Pro Gly 
65 70 75 80 

Lys Pro Leu Asp Thr Asp Lys Phe Phe Val He Gly Val Asn Asn Leu 
85 90 95 

Gly Ser Cys Phe Gly Ser Thr Gly Pro Met Ser He Asp Pro Ser Thr 
100 ~ 105 HO 
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Gly Asn Pro Tyr Gly Ala Thr Phe Pro Val Val Thr Val Glu Asp Trp 
115 120 125 

Val Asn Ala Gin Ala Arg Val Ala Asp Gin Phe Gly lie Thr Arg Phe 
130 135 140 

Ala Ala Val Met Gly Gly Ser Leu Gly Gly Met Gin Ala Leu Ala Trp 
145 150 155 160 

Ser Met Met Tyr Pro Glu Arg Val Ala His Cys He Val Val Ala Ser 
165 170 175 

Thr Pro Lys Leu Ser Ala Gin Asn He Ala Phe Asn Glu Val Ala Arg. 
180 185 190 

Ser Ala He Leu Ser Asp Pro Asp Phe His Gly Gly Asn Tyr Tyr Ala 
195 200 205 

His Asn Val Lys Pro Lys Arg Gly Leu Arg Val Ala Arg Met He Gly 
210 215 220 

is He Thr Tyr Leu Ser Asp Asp Asp Met Ala Glu Lys Phe Gly Arg 
225 230 235 240 

Ser Leu Arg Arg Ala Glu Gly Ala Leu Asp Ala Tyr Asn Phe Asn Phe 
245 250 255 

Asp Val Glu Phe Glu Val Glu Ser Tyr Leu Arg Tyr Gin Gly Asp Lys 
260 265 270 

Phe Ala Asp Tyr Phe Asp Ala Asn Thr Tyr Leu Leu He Thr Arg Ala 
275 280 285 

Leu Asp Tyr Phe Asp Pro Ala Lys Ala Phe Ala Gly Asp Leu Thr Ala 
290 295 300 

Ala Val Ala His Thr Thr Ala Lys Tyr Leu He Ala Ser Phe Thr Thr 
305 310 315 320 



sp Trp Arg Phe Ala Pro Ala Arg Ser Arg Glu Leu Val Lys Ala Leu 
325 330 335 



eu Asp His Lys Arg Thr Val Thr Tyr Ala Glu He Asp Ala Pro His 
340 345 350 

Gly His Asp Ala Phe Leu Leu Asp Asp Ala Arg Tyr His Asn Leu Met 
355 360 ~ 365 

Arg Ala Tyr Tyr Glu Arg He Ala Asn Glu Val Asn Ala 
370 375 380 



<210> 21 

<211> 1134 

<212> DNA 

<213> Nitrosomonas europaea 

<220> 

<221> CDS 

<222> (1) . . (1131) 

<223> RNE02005 
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<400> 21 

atg tec aca caa gat tct gat teg ate ggc ate gta teg gca cga cgc 4 8 
Met Ser Thr Gin Asp Ser Asp Ser lie Gly lie Val Ser Ala Arg Arg 
1 5 . 10 15 

gec cat ttc gac ace ccg etc age ctg aaa age gga get gta ctg gac 96 
Ala His Phe Asp Thr Pro Leu Ser Leu Lys Ser Gly Ala Val Leu Asp 
20 25 " 30 

age tac gag etc gtc tat gaa acc tat ggg gag ctg aat gca gac cga 144 
Ser Tyr Glu Leu Val Tyr Glu Thr Tyr Gly Glu Leu Asn Ala Asp Arg 
35 40 45 

tec aat gca gtg ctg ate tgc cat get tta tec ggc aac cac cat gtt 192 
Ser Asn Ala Val Leu He Cys His Ala Leu Ser Gly Asn His His Val 
50 55 60 



gee ggt gtt tat gca gat aac ccc aag aat acc gga tgg tgg aac aac 240 
Ala Gly Val Tyr Ala Asp Asn Pro Lys Asn Thr Gly Trp Trp Asn Asn 
65 70 75 ' 80 




g ate ggt ccg ggc aaa ccg gtc gat acc cga aaa ttc ttt gtc ate 288 
et He Gly Pro Gly Lys Pro Val Asp Thr Arg Lys Phe Phe Val He 
85 90 95 

ggt ate aat aat etc ggg ggt tgc cat ggc tec acc ggg ccc ate age 336 
Gly He Asn Asn Leu Gly Gly Cys His Gly Ser Thr Gly Pro He Ser 
100 105 110 

ate aac gac aag acc ggt aaa cgc ttc ggc ccg gat ttt ccg ctg gta 384 
He Asn Asp Lys Thr Gly Lys Arg Phe Gly Pro Asp Phe Pro Leu Val 
115 120 125 

acg aca get gac tgg gca aaa acc tat gtc cgt ttc gee gat cag ttc 432 
Thr Thr Ala Asp Trp Ala Lys Thr Tyr Val Arg Phe Ala Asp Gin Phe 
130 135 140 

age ate gac tgt ttt gee gee gtc ate ggt ggc agt ctg ggc ggg atg 480 
Ser He Asp Cys Phe Ala Ala Val He Gly Gly Ser Leu Gly Gly Met 
145 150 155 * 160 

jg gee atg caa ctg gcg etc gat gca ccg gaa aga gtt cgt cat gee 52 8 
x Ala Met Gin Leu Ala Leu Asp Ala Pro Glu Arg Val Arg His Ala 
165 170 175 

ata gtg gtt gca gca teg gee agg ctg aca gca cag aac ate get ttc 576 
He Val Val Ala Ala Ser Ala Arg Leu Thr Ala Gin Asn He Ala Phe 
180 185 190 

aat gat gtc gcg cgt cag gcg att ctg acc gac cct gat ttt cac gac 624 
Asn Asp Val Ala Arg Gin Ala He Leu Thr Asp Pro Asp Phe His Asp 
195 200 205 

ggc gac tat tat tec cat ggc acc cac ccg cgc aga ggt tta cgc ctt 672 
Gly Asp Tyr Tyr Ser His Gly Thr His Pro Arg Arg Gly Leu Arg Leu 
210 215 220 

gee cgc atg ctt ggc cac ate acc tac ctg teg gac gac tec atg gee 720 
Ala Arg Met Leu Gly His He Thr Tyr Leu Ser Asp Asp Ser Met Ala 
225 230 235 * 240 

age aaa ttc ggc cgt gag tta cgt aac ggc teg ctt get ttc aat tat 768 
Ser Lys Phe Gly Arg Glu Leu Arg Asn Gly Ser Leu Ala Phe Asn Tyr 
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245 250 255 

gat gtg gaa ttc cag ate gaa tec tat ctg cac cat cag ggc gac aaa 816 
Asp Val Glu Phe Gin lie Glu Ser Tyr Leu His His Gin Gly Asp Lys 
260 265 270 

ttt gec gac ctg ttc gac gca aac act tat ctg ctg atg acg aag gcg 864 
Phe Ala Asp Leu Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr Lys Ala 
275 280 285 

etc gat tat ttc gat ccg gec cag gat tac gat ggc aac ctg agt gca 912 
Leu Asp Tyr Phe Asp Pro Ala Gin Asp Tyr Asp Gly Asn Leu Ser Ala 
290 295 * 300 

gec ttt gec cgt gca caa gcg gat ttt ctg gta ctt tec ttt act tec 960 
Ala Phe Ala Arg Ala Gin Ala Asp Phe Leu Val Leu Ser Phe Thr Ser 
305 310 315 320 

gac tgg cgt ttt tec ccg gag cgt teg cgc gat ate gtc aag gca ctg 1008 
Asp Trp Arg Phe Ser Pro Glu Arg Ser Arg Asp lie Val Lys Ala Leu 
325 330 335 

tc gac aac aaa ctg aat 1 gtc agt tat gcg gaa att ccc tec teg tac 1056 
Leu Asp Asn Lys Leu Asn Val Ser Tyr Ala Glu lie Pro Ser Ser Tyr 
340 345 350 

gga cat gat tec ttt etc atg cag gac gac tac tat cac cag ttg ata 1104 
Gly His Asp Ser Phe Leu Met Gin Asp Asp Tyr Tyr His Gin Leu lie 
355 360 365 

cgt get tac atg aac aat ate get etc tag 1134 
Arg Ala Tyr Met Asn Asn lie Ala Leu 
370 375 



<210> 22 
<211> 377 
<212> PRT 

<213> Nitrosomonas europaea 
£00 > 22 

,t Ser Thr Gin Asp Ser Asp Ser lie Gly lie Val Ser Ala Arg Arg 
'l 5 10 15 

Ala His Phe Asp Thr Pro Leu Ser Leu Lys Ser Gly Ala Val Leu Asp 
20 25 30 

Ser Tyr Glu Leu Val Tyr Glu Thr Tyr Gly Glu Leu Asn Ala Asp Arg 
35 40 45 

Ser Asn Ala Val Leu lie Cys His Ala Leu Ser Gly Asn His His Val 
50 55 60 

Ala Gly Val Tyr Ala Asp Asn Pro Lys Asn Thr Gly Trp Trp Asn Asn 
65 70 75 80 

Met He Gly Pro Gly Lys Pro Val Asp Thr Arg Lys Phe Phe Val He 
85 90 95 

Gly He Asn Asn Leu Gly Gly Cys His Gly Ser Thr Gly Pro He Ser 
100 105 110 



He Asn Asp Lys Thr Gly Lys Arg Phe Gly Pro Asp Phe Pro Leu Val 
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115 120 125 

Thr Thr Ala Asp Trp Ala Lys Thr Tyr Val Arg Phe Ala Asp Gin Phe 
130 13 5 140 

Ser lie Asp Cys Phe Ala Ala Val lie Gly Gly Ser Leu Gly Gly Met 
145 150 155 160 

Ser Ala Met Gin Leu Ala Leu Asp Ala Pro Glu Arg Val Arg His Ala 
165 170 175 

lie Val Val Ala Ala Ser Ala Arg Leu Thr Ala Gin Asn He Ala Phe 
180 185 190 

Asn Asp Val Ala Arg Gin Ala He Leu Thr Asp Pro Asp Phe His Asp 
195 o 200 205 

Gly Asp Tyr Tyr Ser His Gly Thr His Pro Arg Arg Gly Leu Arg Leu 
210 215 220 

a Arg Met Leu Gly His He Thr Tyr Leu Ser Asp Asp Ser Met Ala 
5 230 235 240 

Ser Lys Phe Gly Arg Glu Leu Arg Asn Gly Ser Leu Ala Phe Asn Tyr 
245 250 255 

Asp Val Glu Phe Gin He Glu Ser Tyr Leu His His Gin Gly Asp Lys 
260 265 270 

Phe Ala Asp Leu Phe Asp Ala Asn Thr Tyr Leu Leu Met Thr Lys Ala 
275 280 285 

Leu Asp Tyr Phe Asp Pro Ala Gin Asp Tyr Asp Gly Asn Leu Ser Ala 
290 295 300 

Ala Phe Ala Arg Ala Gin Ala Asp Phe Leu Val Leu Ser Phe Thr Ser 
305 310 315 320 

Asp Trp Arg Phe Ser Pro Glu Arg Ser Arg Asp He Val Lys Ala Leu 
325 330 335 



Asp Asn Lys Leu Asn Val Ser Tyr Ala Glu He Pro Ser Ser Tyr 
340 345 350 



Gly His Asp Ser Phe Leu Met Gin Asp Asp Tyr Tyr His Gin Leu He 
355 360 365 

Arg Ala Tyr Met Asn Asn He Ala Leu 
370 375 



<210> 23 
<211> 1077 
<212> DNA 

<213> Haemophilus influenzae 

<220> 

<221> CDS 

<222> (1) . . (1074) 

<223> RHI02681 

<400> 23 

atg tct gtg caa aat gta gtg ctt ttt gac aca cag cct tta act ctg 



M/43127 



* 



34 



Met Ser Val Gin Asn Val Val Leu Phe Asp Thr Gin Pro Leu Thr Leu 
15 10 15 

atg ctt ggc ggc aaa ctt tec cat att aat gtc gcg tat caa act tat 96 
Met Leu Gly Gly Lys Leu Ser His lie Asn Val Ala Tyr Gin Thr Tyr 
20 25 30 

ggc acg etc aat gec gaa aaa aat aat gcg gta tta att tgc cac get 144 
Gly Thr Leu Asn Ala Glu Lys Asn Asn Ala Val Leu lie Cys His Ala 
35 40 45 

ttg act ggt gat get gag cct tat ttc gat gat ggt cga gat ggc tgg 192 
Leu Thr Gly Asp Ala Glu Pro Tyr Phe Asp Asp Gly Arg Asp Gly Trp 
50 " 55 60 

tgg cag aat ttt atg gga gca ggt tta gca ttg gat acg gat cgt tat 240 
Trp -Gin Asn Phe Met Gly Ala Gly Leu Ala Leu Asp Thr Asp Arg Tyr 
65 70 75 80 



ttt ttt att age teg aac gta tta ggt ggt tgc aag gga aca act ggg 2 88 
e Phe lie Ser Ser Asn Val Leu Gly Gly Cys Lys Gly Thr Thr Gly 
85 90 95 




cct tea tea att aat ccg caa acg ggt aaa cct tat ggc age caa ttt 336 
Pro Ser Ser lie Asn Pro Gin Thr Gly Lys Pro Tyr Gly Ser Gin Phe 
100 105 110 

cct aat att gtt gtg caa gat att gtt aaa gta caa aaa gee ttg ctt 3 84 
Pro Asn lie Val Val Gin Asp He Val Lys Val Gin Lys Ala Leu Leu 
115 120 125 

gat cat ctt ggt att age cat tta aaa gee att att ggt gga tct ttt 432 
Asp His Leu Gly He Ser His Leu Lys Ala He He Gly Gly Ser Phe 
130 135 140 

99 c 99 c atg caa gcg aat caa tgg gcg att gat tat cct gat ttt atg 4 80 
Gly Gly Met Gin Ala Asn Gin Trp Ala He Asp Tyr Pro Asp Phe Met 
145 150 155 160 

gat aat ate gtg aat ctt tgc tea tec att tat ttt agt get gaa gee 528 
sp Asn He Val Asn Leu Cys Ser Ser He Tyr Phe Ser Ala Glu Ala 
165 170 175 

ta ggt ttt aat cac gta atg cgt caa gcg gtc att aat gat ccc aat 576 
He Gly Phe Asn His Val Met Arg Gin Ala Val He Asn Asp Pro Asn 
180 185 190 

ttt aac ggc ggc gat tat tat gag ggt aca ccg cca gat caa ggg tta 624 
Phe Asn Gly Gly Asp Tyr Tyr Glu Gly Thr Pro Pro Asp Gin Gly Leu 
195 200 205 

tct att gca cgt atg eta ggt atg ctg act tac cgc acc gat tta caa 672 
Ser He Ala Arg Met Leu Gly Met Leu Thr Tyr Arg Thr Asp Leu Gin 
210 215 220 

ctt gcg aaa gee ttt ggg cgt gee aca aaa tea gat ggc age ttt tgg 720 
Leu Ala Lys Ala Phe Gly Arg Ala Thr Lys Ser Asp Gly Ser Phe Trp 
225 230 235 240 

ggc gat tac ttt caa gtg gaa tec tat ctt tct tac caa ggc aaa aaa 768 
Gly Asp Tyr Phe Gin Val Glu Ser Tyr Leu Ser Tyr Gin Gly Lys Lys 
245 " 250 2 55 
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ttc tta gaa cgt ttt gat gcc aat agt tat ttg cat ttg tta cgt gcg 816 

Phe Leu Glu Arg Phe Asp Ala Asn Ser Tyr Leu His Leu Leu Arg Ala 

260 265 270 

ttg gat atg tat gat cca agt ttg ggg tat gac aat gtt aaa gag gca 864 

Leu Asp Met Tyr Asp Pro Ser Leu Gly Tyr Asp Asn Val Lys Glu Ala 
275 280 285 

tta tea cgt att aaa gca cgc tat acg ttg gtt tct gtg aca acg gat 912 

Leu Ser Arg lie Lys Ala Arg Tyr Thr Leu Val Ser Val Thr Thr Asp 
290 295 300 

caa ctt ttt aaa ccc att gat ctt tat aaa agt aaa cag ctt tta gag 960 

Gin Leu Phe Lys Pro lie Asp Leu Tyr Lys Ser Lys Gin Leu Leu Glu 
305 310 315 320 

caa agt gga gtc gat eta cat ttt tat gaa ttc cca tea gat tac gga 1008 

Gin Ser Gly Val Asp Leu His Phe Tyr Glu Phe Pro Ser Asp Tyr Gly 
325 330 335 

c gat gcg ttt tta gtg gat tat gat cag ttt gaa aaa cga att cga 1056 

s Asp Ala Phe Leu Val Asp Tyr Asp Gin Phe Glu Lys Arg lie Arg 

340 345 350 

gat ggt ttg gca ggt aat taa 1077 
Asp Gly Leu Ala Gly Asn 
355 



<210> 24 
<211> 358 
<212> PRT 

<213> Haemophilus influenzae 
<4O0> 24 

Met Ser Val Gin Asn Val Val Leu Phe Asp Thr Gin Pro Leu Thr Leu 
15 10 15 

Met Leu Gly Gly Lys Leu Ser His lie Asn Val Ala Tyr Gin Thr Tyr 
20 25 30 



Thr Leu Asn Ala Glu Lys Asn Asn Ala Val Leu lie Cys His Ala 
35 40 45 



Leu Thr Gly Asp Ala Glu Pro Tyr Phe Asp Asp Gly Arg Asp Gly Trp 
50 55 60 

Trp Gin Asn Phe Met Gly Ala Gly Leu Ala Leu Asp Thr Asp Arg Tyr 
65 70 ' 75 80 

Phe Phe He Ser Ser Asn Val Leu Gly Gly Cys Lys Gly Thr Thr Gly 
85 90 95 

Pro Ser Ser He Asn Pro Gin Thr Gly Lys Pro Tyr Gly Ser Gin Phe 
100 105 110 

Pro Asn He Val Val Gin Asp He Val Lys Val Gin Lys Ala Leu Leu 
115 120 125 

Asp His Leu Gly He Ser His Leu Lys Ala He He Gly Gly Ser Phe 
130 135 140 



Gly Gly Met Gin Ala Asn Gin Trp Ala He Asp Tyr Pro Asp Phe Met 
M/43127 
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145 150 155 160 

Asp Asn lie Val Asn Leu Cys Ser Ser lie Tyr Phe Ser Ala Glu Ala 
165 170 175 

lie Gly Phe Asn His Val Met Arg Gin Ala Val lie Asn Asp Pro Asn 
180 185 190 

Phe Asn Gly Gly Asp Tyr Tyr Glu Gly Thr Pro Pro Asp Gin Gly Leu 
195 200 205 

Ser lie Ala Arg Met Leu Gly Met Leu Thr Tyr Arg Thr Asp Leu Gin 
210 215 220 

Leu Ala Lys Ala Phe Gly Arg Ala Thr Lys Ser Asp Gly Ser Phe Trp 
225 230 235 240 

Gly Asp Tyr Phe Gin Val Glu Ser Tyr Leu Ser Tyr Gin Gly Lys Lys 
245 250 255 



e Leu Glu Arg Phe Asp Ala Asn Ser Tyr Leu His Leu Leu Arg Ala 
260 265 270 




Leu Asp Met Tyr Asp Pro Ser Leu Gly Tyr Asp Asn Val Lys Glu Ala 
275 280 285 

Leu Ser Arg lie Lys Ala Arg Tyr Thr Leu Val Ser Val Thr Thr Asp 
290 295 300 

Gin Leu Phe Lys Pro lie Asp Leu Tyr Lys Ser Lys Gin Leu Leu Glu 
305 310 315 320 

Gin Ser Gly Val Asp Leu His Phe Tyr Glu Phe Pro Ser Asp Tyr Gly 
325 330 335 

His Asp Ala Phe Leu Val Asp Tyr Asp Gin Phe Glu Lys Arg lie Arg 
340 345 350 

Asp Gly Leu Ala Gly Asn 
355 



10> 25 
11> 1296 
<212> DNA 

<213> Halobacterium sp 

<220> 

<221> CDS 

<222> (1) . . (1293) 

<223> ETX_HALN1 

<400> 25 

atg ggc cac gat cac gga etc cac acc aac agt gta cac gec ggc cag 4 8 
Met Gly His Asp His Gly Leu His Thr Asn Ser Val His Ala Gly Gin 
15 10 15 

cgc gtc gac ccg gec acg ggc get cgc gcg ccg cca etc tac cag acc 96 
Arg Val Asp Pro Ala Thr Gly Ala Arg Ala Pro Pro Leu Tyr Gin Thr 
20 25 30 

acg teg tac gee ttc gag gac age gec gat gec gec ggc cag ttc gec 144 
Thr Ser Tyr Ala Phe Glu Asp Ser Ala Asp Ala Ala Gly Gin Phe Ala 
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35 40 45 

ctt gag egg gac ggc tac ate tac teg egg ctg atg aac ccc ace gtg 

Leu Glu Arg Asp Gly Tyr lie Tyr Ser Arg Leu Met Asn Pro Thr Val 

50 55 60 

gag acc etc cag gac cgc etc gee gee etc gaa ggc ggc gtc ggc gcg 

Glu Thr Leu Gin Asp Arg Leu Ala Ala Leu Glu Gly Gly Val Gly Ala 

65 70 75 80 

gtc gec acc gcg tec gga atg gec gee ctg gac etc gcg acg ttc ctg 

Val Ala Thr Ala Ser Gly Met Ala Ala Leu Asp Leu Ala Thr Phe Leu 

85 90 95 

ctg gca cgc gee ggc gac tec gtc gtc gec gee age gac etc tac ggc 

Leu Ala Arg Ala Gly Asp Ser Val Val Ala Ala Ser Asp Leu Tyr Gly 

100 105 110 

ggc acc gtg acg tac etc acg cac age gee cag cgc cgc ggc gtc gac 

Gly Thr Val Thr Tyr Leu Thr His Ser Ala Gin Arg Arg Gly Val Asp 

115 120 125 

r cg acg ttc gtg gac gtc etc gac tac gac gee tac gee gac gee ate 

Thr Thr Phe Val Asp Val Leu Asp Tyr Asp Ala Tyr Ala Asp Ala lie 

130 135 140 

gac gee gac acc gee tac gtg etc gtc gaa acc gtc ggc aac ccc age 

Asp Ala Asp Thr Ala Tyr Val Leu Val Glu Thr Val Gly Asn Pro Ser 

145 150 155 160 

ctg ate acg ccc gac etc gaa cgc ate gec gac ate gec cac gac aac 

Leu He Thr Pro Asp Leu Glu Arg He Ala Asp He Ala His Asp Asn 

165 170 175 

ggc gtt ccc ctg ctg gtg gac aac acg ttc gcg acc ccc gcg ctg gca 

Gly Val Pro Leu Leu Val Asp Asn Thr Phe Ala Thr Pro Ala Leu Ala 

180 185 190 

acc ccg ate gac cac ggt gee gac ate gtc tgg cac tec acc acc aaa 

Thr Pro He Asp His Gly Ala Asp He Val Trp His Ser Thr Thr Lys 

195 200 205 



ate cac ggt gee ggc acc acc gtc ggc ggc gcg etc gtc gac gee 
He His Gly Ala Gly Thr Thr Val Gly Gly Ala' Leu Val Asp Ala 
210 215 220 



ggc age ttc gac tgg gac gee cac gee gee gac tac ccc gag ate gec 
Gly Ser Phe Asp Trp Asp Ala His Ala Ala Asp Tyr Pro Glu He Ala 
225 230 235 240 

cag gaa aac ccc gee tac cac ggc gtg acc ttc acc gat cgc ttc ggg 
Gin Glu Asn Pro Ala Tyr His Gly Val Thr Phe Thr Asp Arg Phe Gly 
245 250 255 



gac gee gcg ttc acg tac gec gca ate gec cgc ggg ctg cgc gat ctg 

Asp Ala Ala Phe Thr Tyr Ala Ala He Ala Arg Gly Leu Arg Asp Leu 
260 265 270 

ggc aac cag cag teg ccg ttc gac gec tgg cag acc etc cag aag etc 

Gly Asn Gin Gin Ser Pro Phe Asp Ala Trp Gin Thr Leu Gin Lys Leu 
275 280 285 

gaa acg etc ccg ctg cgc atg caa caa cac tgc egg aac gee cag etc 

M/43127 



192 
240 
288 
336 
384 
432 
480 
528 
576 
624 
672 
720 
768 
816 
864 
912 
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Glu Thr Leu Pro Leu Arg Met Gin Gin His Cys Arg Asn Ala Gin Leu 
290 295 300 

gtc gcc gaa cac etc egg gac cac ccc aac gtg teg tgg gtc aac tac 960 

Val Ala Glu His Leu Arg Asp His Pro Asn Val Ser Trp Val Asn Tyr 
305 310 315 320 

ccc ggg ctg gcc gac cac gac ace cac gac aac gca acc ace tac etc 1008 

Pro Gly Leu Ala Asp His Asp Thr His Asp Asn Ala Thr Thr Tyr Leu 
325 330 335 

gat teg ggc tac gga ggc atg etc acg ttc ggc gtc gag gac ggc tac 1056 

Asp Ser Gly Tyr Gly Gly Met Leu Thr Phe Gly Val Glu Asp Gly Tyr 
340 345 350 

gag gcc gcc caa teg gtc acc gag gag acc acg ctt gcc age ctg ctg 1104 

Glu Ala Ala Gin Ser Val Thr Glu Glu Thr Thr Leu Ala Ser Leu Leu 

355 360 365 

cfcg aac gtc ggc gac gcc aaa acg etc gtg ate cac ccc gcc tec acc 1152 

a Asn Val Gly Asp Ala Lys Thr Leu Val lie His Pro Ala Ser Thr 
370 375 380 

acc cac cag cag etc acc ccc gaa gcc cag cgc gcc ggc ggt gtg cgc 1200 

Thr His Gin Gin Leu Thr Pro Glu Ala Gin Arg Ala Gly Gly Val Arg 
385 390 395 400 

ccc gag atg gtg egg gtg teg gtc ggc ate gag gac ccc gcc gac ate 1248 

Pro Glu Met Val Arg Val Ser Val Gly lie Glu Asp Pro Ala Asp He 
405 410 415 

gtc gcg gac etc gaa acc gcc ate gag gcc gcg gtc ggg teg gcg 1293 

Val Ala Asp Leu Glu Thr Ala He Glu Ala Ala Val Gly Ser Ala 
420 425 ~ 430 

tag 1296 




<210> 26 
<211> 431 
k 212> PRT 
13 > Halobacterium sp 

^00> 26 

Met Gly His Asp His Gly Leu His Thr Asn Ser Val His Ala Gly Gin 
15 10 15 

Arg Val Asp Pro Ala Thr Gly Ala Arg Ala Pro Pro Leu Tyr Gin Thr 
20 25 30 

Thr Ser Tyr Ala Phe Glu Asp Ser Ala Asp Ala Ala Gly Gin Phe Ala 
35 40 45 

Leu Glu Arg Asp Gly Tyr He Tyr Ser Arg Leu Met Asn Pro Thr Val 
50 55 60 

Glu Thr Leu Gin Asp Arg Leu Ala Ala Leu Glu Gly Gly Val Gly Ala 
65 70 75 80 

Val Ala Thr Ala Ser Gly Met Ala Ala Leu Asp Leu Ala Thr Phe Leu 
85 90 95 



Leu Ala Arg Ala Gly Asp Ser Val Val Ala Ala Ser Asp Leu Tyr Gly 
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100 105 110 

Gly Thr Val Thr Tyr Leu Thr His Ser Ala Glri Arg Arg Gly Val Asp 
115 120 125 

Thr Thr Phe Val Asp Val Leu Asp Tyr Asp Ala Tyr Ala Asp Ala He 
130 135 140 

Asp Ala Asp Thr Ala Tyr Val Leu Val Glu Thr Val Gly Asn Pro Ser 
145 150 155 160 

Leu He Thr Pro Asp Leu Glu Arg He Ala Asp He Ala His Asp Asn 
165 170 175 

Gly Val Pro Leu Leu Val Asp Asn Thr Phe Ala Thr Pro Ala Leu Ala 
180 185 190 

Thr Pro He Asp His Gly Ala Asp He Val Trp His Ser Thr Thr Lys 
195 200 205 

rp He His Gly Ala Gly Thr Thr Val Gly Gly Ala Leu Val Asp Ala 
210 215 220 

Gly Ser Phe Asp Trp Asp Ala His Ala Ala Asp Tyr Pro Glu He Ala 
225 230 235 240 

Gin Glu Asn Pro Ala Tyr His Gly Val Thr Phe Thr Asp Arg Phe Gly 
245 250 255 

Asp Ala Ala Phe Thr Tyr Ala Ala He Ala Arg Gly Leu Arg Asp Leu 
260 265 270 

Gly Asn Gin Gin Ser Pro Phe Asp Ala Trp Gin Thr Leu Gin Lys Leu 
275 280 285 

Glu Thr Leu Pro Leu Arg Met Gin Gin His Cys Arg Asn Ala Gin Leu 
290 295 300 

Val Ala Glu His Leu Arg Asp His Pro Asn Val Ser Trp Val Asn Tyr 
305 310 315 320 

o Gly Leu Ala Asp His Asp Thr His Asp Asn Ala Thr Thr Tyr Leu 
325 330 335 

Asp Ser Gly Tyr Gly Gly Met Leu Thr Phe Gly Val Glu Asp Gly Tyr 
340 345 350 

Glu Ala Ala Gin Ser Val Thr Glu Glu Thr Thr Leu Ala Ser Leu Leu 
355 360 365 

Ala Asn Val Gly Asp Ala Lys Thr Leu Val He His Pro Ala Ser Thr 
370 375 380 

Thr His Gin Gin Leu Thr Pro Glu Ala Gin Arg Ala Gly Gly Val Arg 
385 390 395 400 

Pro Glu Met Val Arg Val Ser Val Gly He Glu Asp Pro Ala Asp He 
405 410 415 

Val Ala Asp Leu Glu Thr Ala He Glu Ala Ala Val Gly Ser Ala 
420 425 430 
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<210> 27 

<211> 1143 

<212> DNA 

<213> Thermus thermophilus 

<220> 

<221> CDS 

<222> (1) . . (1140) 

<223> RTT00268 



<400> 27 

atg age gag ate gec etc gag gee tgg ggg gag cac gag gee etc etc 48 
Met Ser Glu He Ala Leu Glu Ala Trp Gly Glu His Glu Ala Leu Leu 
15 10 15 

etc aag ccc ccc cgc tec ccc etc tec ate ccc ccg ccc aag ccc cgc 96 
Leu Lys Pro Pro Arg Ser Pro Leu Ser He Pro Pro Pro Lys Pro Arg 
20 25 30 



• 



ace gee gtc etc ttc ccc agg egg gag ggg ttc tac acg gag etc ggg 144 
r Ala Val Leu Phe Pro Arg Arg Glu Gly Phe Tyr Thr Glu Leu Gly 
35 40 45 



ggg tac etc ccc gag gtg cgc etc cgc ttt gag ace tac ggg ace etc 192 
Gly Tyr Leu Pro Glu Val Arg Leu Arg Phe Glu Thr Tyr Gly Thr Leu 
50 55 60 

tec cgc agg egg gat aac gee gtc etc gtc ttc cac gee etc acg ggg 240 
Ser Arg Arg Arg Asp Asn Ala Val Leu Val Phe His Ala Leu Thr Gly 
65 70 75 80 

age gee cac ctg gcg ggg ace tac gac gag gaa ace ttt aga age etc 288 
Ser Ala His Leu Ala Gly Thr Tyr Asp Glu Glu Thr Phe Arg Ser Leu 
85 90 95 

tec ccc ctg gag cag gee ttc ggc egg gaa ggg tgg tgg gac age ctg 336 
Ser Pro Leu Glu Gin Ala Phe Gly Arg Glu Gly Trp Trp Asp Ser Leu 
100 105 110 



^^jc 



gtg ggg ccc ggg egg ate ctg gac ccc gee etc tac tac gtg gtc tec 3 84 
k al Gly Pro Gly Arg He Leu Asp Pro Ala Leu Tyr Tyr Val Val Ser 
115 120 125 



cc aac cac ctg gga age tgc tac ggc tec ace ggc ccc etc tec eta 432 

Ala Asn His Leu Gly Ser Cys Tyr Gly Ser Thr Gly Pro Leu Ser Leu 
130 135 140 

gac ccc cac acg ggc cgc ccc tac ggg agg gac ttc cct ccc ctt ace 4 80 

Asp Pro His Thr Gly Arg Pro Tyr Gly Arg Asp Phe Pro Pro Leu Thr 
145 150 155 160 

ate cgc gac ctg gee egg gee cag gcg agg ctt ctg gac cat ctg ggg 52 8 

He Arg Asp Leu Ala Arg Ala Gin Ala Arg Leu Leu Asp His Leu Gly 
165 170 * 175 

gtg gag aag gee ate gtc ate ggg ggg age etc ggg ggg atg gtg gee 576 

Val Glu Lys Ala He Val lie Gly Gly Ser Leu Gly Gly Met Val Ala 
180 185 190 

ctg gag ttc gee etc atg tac ccg gag agg gtg aag aag etc gtg gtc 624 

Leu Glu Phe Ala Leu Met Tyr Pro Glu Arg Val Lys Lys Leu Val Val 

195 200 205 
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ctg gcg gcc ccc gca egg cac ggc ccc tgg gec egg gec ttc aac cac 672 

Leu Ala Ala Pro Ala Arg His Gly Pro Trp Ala Arg Ala Phe Asn His 
210 215 220 

etc tec cgc cag gcc ate etc caa gac ccc gag tac cag aag ggc aac 720 

Leu Ser Arg Gin Ala lie Leu Gin Asp Pro Glu Tyr Gin Lys Gly Asn 
225 230 235 " 240 

cct gcc ccc aag ggc atg gcc etc gcc egg gga ate gcc atg atg age 768 

Pro Ala Pro Lys Gly Met Ala Leu Ala Arg Gly lie Ala Met Met Ser 

245 250 255 

tac egg gcc ccc gag ggg ttt gag gcc cgc tgg ggc gcg gag ccc gag 816 

Tyr Arg Ala Pro Glu Gly Phe Glu Ala Arg Trp Gly Ala Glu Pro Glu 
260 265 270 

etc ggg gaa ate cac ctg gac tac cag ggg gag aag ttc etc egg cgc 864 

Leu Gly Glu lie His Leu Asp Tyr Gin Gly Glu Lys Phe Leu Arg Arg 
275 280 285 



tc cac gcc gag age tac etc gtc etc tec egg gcc atg gac aac cac 912 
e His Ala Glu Ser Tyr Leu Val Leu Ser Arg Ala Met Asp Asn His 
290 295 300 




gac gtg ggc egg ggc egg ggc ggg gtg gag gag gcc ctg aag cgc etc 960 

Asp Val Gly Arg Gly Arg Gly Gly Val Glu Glu Ala Leu Lys Arg Leu 
305 310 315 320 

agg gcc ate ccc tec etc ttc gtg ggc att gac ace gac etc etc tac 1008 

Arg Ala lie Pro Ser Leu Phe Val Gly lie Asp Thr Asp Leu Leu Tyr 
325 330 335 

ccc gcc tgg gag gtg agg cag gcg gcc aag gcg gcg ggg gcc cgc tac 1056 

Pro Ala Trp Glu Val Arg Gin Ala Ala Lys Ala Ala Gly Ala Arg Tyr 
340 345 350 

egg gag ate aaa age ccc cac ggg cac gac gcc ttc etc ata gag ace 1104 

Arg Glu lie Lys Ser Pro His Gly His Asp Ala Phe Leu lie Glu Thr 

355 360 365 

cic cag gtg gag gag ate ctg gac gcc ttc etc ccg tag 114 3 

p Gin Val Glu Glu lie Leu Asp Ala Phe Leu Pro 
370 375 380 



<210> 28 
<211> 380 
<212> PRT 

<213> Thermus thermophilus 
<400> 28 

Met Ser Glu lie Ala Leu Glu Ala Trp Gly Glu His Glu Ala Leu Leu 
1 5 10 15 

Leu Lys Pro Pro Arg Ser Pro Leu Ser lie Pro Pro Pro Lys Pro Arg 
20 25 3 0 

Thr Ala Val Leu Phe Pro Arg Arg Glu Gly Phe Tyr Thr Glu Leu Gly 
35 40 45 

Gly Tyr Leu Pro Glu Val Arg Leu Arg Phe Glu Thr Tyr Gly Thr Leu 
50 55 " 60 
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Ser Arg Arg Arg Asp Asn Ala Val Leu Val Phe His Ala Leu Thr Gly 
65 70 75 80 

Ser Ala His Leu Ala Gly Thr Tyr Asp Glu Glu Thr Phe Arg Ser Leu 
85 90 95 

Ser Pro Leu Glu Gin Ala Phe Gly Arg Glu Gly Trp Trp Asp Ser Leu 
100 105 * 110 

Val Gly Pro Gly Arg lie Leu Asp Pro Ala Leu Tyr Tyr Val Val Ser 
115 120 125 

Ala Asn His Leu Gly Ser Cys Tyr Gly Ser Thr Gly Pro Leu Ser Leu 
130 135 140 

Asp Pro His Thr Gly Arg Pro Tyr Gly Arg Asp Phe Pro Pro Leu Thr 
145 150 155 160 



lie Arg Asp Leu Ala Arg Ala Gin Ala Arg Leu Leu Asp His Leu Gly 
165 170 175 



1 Glu Lys Ala He Val He Gly Gly Ser Leu Gly Gly Met Val Ala 
180 185 190 



Leu Glu Phe Ala Leu Met Tyr Pro Glu Arg Val Lys Lys Leu Val Val 
195 200 205 

Leu Ala Ala Pro Ala Arg His Gly Pro Trp Ala Arg Ala Phe Asn His 
210 215 220 

Leu Ser Arg Gin Ala He Leu Gin Asp Pro Glu Tyr Gin Lys Gly Asn 
225 230 235 " 240 

Pro Ala Pro Lys Gly Met Ala Leu Ala Arg Gly He Ala Met Met Ser 
245 250 255 

Tyr Arg Ala Pro Glu Gly Phe Glu Ala Arg Trp Gly Ala Glu Pro Glu 
260 265 270 




Leu Gly Glu He His Leu Asp Tyr Gin Gly Glu Lys Phe Leu Arg Arg 

275 280 285 

e His Ala Glu Ser Tyr Leu Val Leu Ser Arg Ala Met Asp Asn His 
290 295 300 



Asp Val Gly Arg Gly Arg Gly Gly Val Glu Glu Ala Leu Lys Arg Leu 
305 310 315 320 

Arg Ala He Pro Ser Leu Phe Val Gly He Asp Thr Asp Leu Leu Tyr 
325 330 335 

Pro Ala Trp Glu Val Arg Gin Ala Ala Lys Ala Ala Gly Ala Arg Tyr 
340 345 350 

Arg Glu He Lys Ser Pro His Gly His Asp Ala Phe Leu He Glu Thr 
355 360 365 



Asp Gin Val Glu Glu He Leu Asp Ala Phe Leu Pro 
370 375 380 



<210> 29 
<211> 1005 
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<212> DNA 

<213> Deinococcus radiodurans 

<220> 

<221> CDS 

<222> (1) . . (1002) 

<223> RDR01287 

<400> 29 

gtg acc gcc gtg etc gcg ggc cac gec tct gec ctg ctg ctg acc gaa 

Val Thr Ala Val Leu Ala Gly His Ala Ser Ala Leu Leu Leu Thr Glu 

15 10 15 

gaa ccc gac tgt teg ggg ccg cag acg gtc gtt etc ttc egg cgt gag 
Glu Pro Asp Cys Ser Gly Pro Gin Thr Val Val Leu Phe Arg Arg Glu 
20 25 30 

ccg ctg ctg etc gac tgc gga egg gcg ctg age gac gtg egg gtg gcc 
Pro Leu Leu Leu Asp Cys Gly Arg Ala Leu Ser Asp Val Arg Val Ala 
35 40 45 



t cac acc tac ggc acg ccg cgc gcc gac gcc acg ctg gtg ctg cac 

he His Thr Tyr Gly Thr Pro Arg Ala Asp Ala Thr Leu Val Leu His 

50 55 60 

gcc ctg acc ggc gac age gcg gtg cac gag tgg tgg ccc gac ttt ctg 

Ala Leu Thr Gly Asp Ser Ala Val His Glu Trp Trp Pro Asp Phe Leu 

65 70 75 80 

ggc gcg ggc egg cca ctg gac ccg gca gac gac tac gtg gtg tgc gcc 

Gly Ala Gly Arg Pro Leu Asp Pro Ala Asp Asp Tyr Val Val Cys Ala 

85 90 95 

aac gtc etc ggc ggg tgc gcc ggc acg acg age gcc get gaa etc gcc 

Asn Val Leu Gly Gly Cys Ala Gly Thr Thr Ser Ala Ala Glu Leu Ala 

100 105 110 

gcc acc tgt tec gga ccg gtg ccg etc age ctg cgc gac atg gcc egg 

Ala Thr Cys Ser Gly Pro Val Pro Leu Ser Leu Arg Asp Met Ala Arg 

115 120 125 



9 999 cgc gcc ctg ctg gat tct etc ggc gtg cga egg gtg egg gtc 
1 Gly Arg Ala Leu Leu Asp Ser Leu Gly Val Arg Arg Val Arg Val 
130 135 140 



ate ggc gcg age atg ggc ggg atg etc gcc tac gcc tgg ctg ctg gag 
He Gly Ala Ser Met Gly Gly Met Leu Ala Tyr Ala Trp Leu Leu Glu 
145 150 155 160 

tgc ccc gac ctg gtg gaa aag gcc gtg att ata gga. gcc ccg gcg egg 
Cys Pro Asp Leu Val Glu Lys Ala Val He He Gly Ala Pro Ala Arg 
165 170 175 

cac teg ccc tgg get att gga ctg aac acg gcg gcc cgc age gcc att 
His Ser Pro Trp Ala He Gly Leu Asn Thr Ala Ala Arg Ser Ala He 
180 185 190 

gcc etc get ccc ggc ggc gag ggg ctg aag gtg gcg cgc cag att gcc 
Ala Leu Ala Pro Gly Gly Glu Gly Leu Lys Val Ala Arg Gin He Ala 
195 200 205 

atg etc agt tac cgc age ccc gaa age eta age cgc acg cag gcg ggg 
Met Leu Ser Tyr Arg Ser Pro Glu Ser Leu Ser Arg Thr Gin Ala Gly 
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210 215 220 

cag cgc gtg ccg ggg gtg ccc gcc gtt acg tct tac ctg cac tac caa 720 
Gin Arg Val Pro Gly Val Pro Ala Val Thr Ser Tyr Leu His Tyr Gin 
225 230 235 240 

ggc gaa aaa etc gcc gcc cgc ttc gac gag cag acc tac tgc gcc etc 768 
Gly Glu Lys Leu Ala Ala Arg Phe Asp Glu Gin Thr Tyr Cys Ala Leu 
245 ' 250 255 

acc tgg gcg atg gac gcc ttt cag ccg age age gcc gac etc aaa gcg 816 
Thr Trp Ala Met Asp Ala Phe Gin Pro Ser Ser Ala Asp Leu Lys Ala 
260 265 270 

gtg cgc gcg ccg gta etc gtc gtc ggc ate tec age gat ctg etc tac 864 
Val Arg Ala Pro Val Leu Val Val Gly He Ser Ser Asp Leu Leu Tyr 
275 280 285 

ccc gcc gcc gag gtc cgc gcc tgc gcc gcc gag ctt ccc cac gcc gac 912 
Pro Ala Ala Glu Val Arg Ala Cys Ala Ala Glu Leu Pro His Ala Asp 
290 295 300 

ac tgg gaa ctg ggc age att cac ggc cac gac gcc ttt ttg atg gac 960 
Tyr Trp Glu Leu Gly Ser He His Gly His Asp Ala Phe Leu Met Asp 
305 310 315 320 

cca cag gac ttg ccg gag egg gtg ggg gcg ttt etc agg agt 1002 
Pro Gin Asp Leu Pro Glu Arg Val Gly Ala Phe Leu Arg Ser 
325 330 

tga 1005 




<210> 30 
<211> 334 
<212> PRT 

<213> Deinococcus radiodurans 
<400> 30 

Val Thr Ala Val Leu Ala Gly His Ala Ser Ala Leu Leu Leu Thr Glu 
15 10 15 

u Pro Asp Cys Ser Gly Pro Gin Thr Val Val Leu Phe Arg Arg Glu 
20 25 30 

Pro Leu Leu Leu Asp Cys Gly Arg Ala Leu Ser Asp Val Arg Val Ala 
35 40 45 

Phe His Thr Tyr Gly Thr Pro Arg Ala Asp Ala Thr Leu Val Leu His 
50 55 60 

Ala Leu Thr Gly Asp Ser Ala Val His Glu Trp Trp Pro Asp Phe Leu 
65 70 75 80 

Gly Ala Gly Arg Pro Leu Asp Pro Ala Asp Asp Tyr Val Val Cys Ala 
85 90 95 

Asn Val Leu Gly Gly Cys Ala Gly Thr Thr Ser Ala Ala Glu Leu Ala 
100 105 110 

Ala Thr Cys Ser Gly Pro Val Pro Leu Ser Leu Arg Asp Met Ala Arg 
115 120 125 
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Val Gly Arg Ala Leu Leu Asp Ser Leu Gly Val Arg Arg Val Arg Val 
130 135 140 

lie Gly Ala Ser Met Gly Gly Met Leu Ala Tyr Ala Trp Leu Leu Glu 
145 150 155 160 

Cys Pro Asp Leu Val Glu Lys Ala Val lie lie Gly Ala Pro Ala Arg 
165 170 175 

His Ser Pro Trp Ala lie Gly Leu Asn Thr Ala Ala Arg Ser Ala lie 
180 185 190 

Ala Leu Ala Pro Gly Gly Glu Gly Leu Lys Val Ala Arg Gin lie Ala 
195 200 205 

Met Leu Ser Tyr Arg Ser Pro Glu Ser Leu Ser Arg Thr Gin Ala Gly 
210 215 220 




Gin Arg Val Pro Gly Val Pro Ala Val Thr Ser Tyr Leu His Tyr Gin 
225 230 235 240 



lly Glu Lys Leu Ala Ala Arg Phe Asp Glu Gin Thr Tyr Cys Ala Leu 
245 250 255 



Thr Trp Ala Met Asp Ala Phe Gin Pro Ser Ser Ala Asp Leu Lys Ala 
260 265 270 

Val Arg Ala Pro Val Leu Val Val Gly lie Ser Ser Asp Leu Leu Tyr 
275 280 285 

Pro Ala Ala Glu Val Arg Ala Cys Ala Ala Glu Leu Pro His Ala Asp 
290 295 300 

Tyr Trp Glu Leu Gly Ser lie His Gly His Asp Ala Phe Leu Met Asp 
305 310 315 320 



Pro Gin Asp Leu Pro Glu Arg Val Gly Ala Phe Leu Arg Ser 
325 330 



31 

1461 
DNA 

Saccharomyces cerevisiae 

<220> 

<221> CDS 

<222> (1) . . (1458) 

<223> RSC08123 

<400> 31 

atg teg cat act tta aaa teg aaa acg etc caa gag ctg gac att gag 48 

Met Ser His Thr Leu Lys Ser Lys Thr Leu Gin Glu Leu Asp lie Glu 
15 10 15 

gag att aag gaa act aac cca ttg etc aaa eta gtt caa ggg cag agg 96 
Glu lie Lys Glu Thr Asn Pro Leu Leu Lys Leu Val Gin Gly Gin Arg 
20 25 30 

att gtt caa gtt ccg gaa eta gtg ctt gag tct ggc gtg gtc ata aat 144 
lie Val Gin Val Pro Glu Leu Val Leu Glu Ser Gly Val Val lie Asn 
35 40 " 45 



«<210> 
■ U> 
Hl2> 
T213> 
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aat ttc cct att get tat aag acg tgg ggt aca ctg aat gaa get ggt 192 
Asn Phe Pro lie Ala Tyr Lys Thr Trp Gly Thr Leu Asn Glu Ala Gly 
50 . 55 60 

gat aat gtt ctg gta att tgt cat gec ttg act ggg tec gca gat gtt 24 0 
Asp Asn Val Leu Val lie Cys His Ala Leu Thr Gly Ser Ala Asp Val 
65 70 75 80 

get gac tgg tgg ggc cct ctt ctg ggt aac gac tta gca ttc gac cca 2 88 
Ala Asp Trp Trp Gly Pro Leu Leu Gly Asn Asp Leu Ala Phe Asp Pro 
85 90 95 

tea agg ttt ttt ate ata tgt tta aac tct atg ggc tct cca tat ggg 3 36 
Ser Arg Phe Phe lie lie Cys Leu Asn Ser Met Gly Ser Pro Tyr Gly 
100 105 110 

tct ttt teg cca tta acg ata aat gag gag acg ggc gtt aga tat gga 3 84 
Ser Phe Ser Pro Leu Thr lie Asn Glu Glu Thr Gly Val Arg Tyr Gly 
115 120 125 

cc gaa ttc cca tta tgt act gtg cgc gat gac gtt aga get cac aga 432 
ro Glu Phe Pro Leu Cys Thr Val Arg Asp Asp Val Arg Ala His Arg 
13 0 135 140 

att gtt ctg gat tct ctg gga gta aag tea ata gec tgt gtt att ggt 4 80 
lie Val Leu Asp Ser Leu Gly Val Lys Ser lie Ala Cys Val lie Gly 
145 150 - 155 160 

ggc tct atg ggg ggg atg ctg agt ttg gaa tgg get gec atg tat ggt 528 
Gly Ser Met Gly Gly Met Leu Ser Leu Glu Trp Ala Ala Met Tyr Gly 
165 170 175 

aag gaa tat gtg aag aat atg gtt get ctg gcg aca tea gca aga cat 57 6 
Lys Glu Tyr Val Lys Asn Met Val Ala Leu Ala Thr Ser Ala Arg His 
180 185 190 

tct gee tgg tgc ata teg tgg tct gag get caa aga caa teg att tac 624 
Ser Ala Trp Cys He Ser Trp Ser Glu Ala Gin Arg Gin Ser He Tyr 
195 200 205 



• 



ca gat ccc aac tac ttg gac ggg tac tat ccg gta gag gag caa cct 672 
r Asp Pro Asn Tyr Leu Asp Gly Tyr Tyr Pro Val Glu Glu Gin Pro 
210 215 220 



gtg gee gga eta teg get gca cgt atg tct gca ttg ttg acg tac agg 72 0 
Val Ala Gly Leu Ser Ala Ala Arg Met Ser Ala Leu Leu Thr Tyr Arg 
225 230 235 240 

aca aga aac agt ttc gag aac aaa ttc tec aga aga tct cct tea ata 768 
Thr Arg Asn Ser Phe Glu Asn Lys Phe Ser Arg Arg Ser Pro Ser He 
245 250 ~ 255 

gca caa caa caa aaa get caa agg gag gag aca cgc aaa cca tct act 816 
Ala Gin Gin Gin Lys Ala Gin Arg Glu Glu Thr Arg Lys Pro Ser Thr 
260 265 270 

gtc age gaa cac tec eta caa ate cac aat gat ggg tat aaa aca aaa 864 
Val Ser Glu His Ser Leu Gin He His Asn Asp Gly Tyr Lys Thr Lys 
275 280 285 

gec age act gec ate get ggc att tct ggg caa aaa ggt caa age gtg 912 
Ala Ser Thr Ala He Ala Gly He Ser Gly Gin Lys Gly Gin Ser Val 
290 295 300 
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gtg tec acc gca tct tct teg gat tea ttg aat tct tea aca teg atg 960 
Val Ser Thr Ala Ser Ser Ser Asp Ser Leu Asn Ser Ser Thr Ser Met 
305 310 315 320 

act teg gta agt tct gta acg ggt gaa gtg aag gac ata aag cct gcg 1008 
Thr Ser Val Ser Ser Val Thr Gly Glu Val Lys Asp lie Lys Pro Ala 
325 330 335 

cag acg tat ttt tct gca caa agt tac ttg agg tac cag ggc aca aag 1056 
Gin Thr Tyr Phe Ser Ala Gin Ser Tyr Leu Arg Tyr Gin Gly Thr Lys 
340 345 350 

ttc ate aat agg ttc gac gee aat tgt tac att gee ate aca cgt aaa 1104 
Phe lie Asn Arg Phe Asp Ala Asn Cys Tyr lie Ala He Thr Arg Lys 
355 360 365 

ctg gat acg cac gat ttg gca aga gac aga gta gat gac ate act gag 1152 
Leu Asp Thr His Asp Leu Ala Arg Asp Arg Val Asp Asp He Thr Glu 
370 375 380 



c ctt tct acc ate caa caa cca tec ctg ate ate ggt ate caa tct 1200 
al Leu Ser Thr He Gin Gin Pro Ser Leu He He Gly He Gin Ser 
385 390 395 400 

gat gga ctg ttc aca tat tea gaa caa gaa ttt ttg get gag cac ata 1248 
Asp Gly Leu Phe Thr Tyr Ser Glu Gin Glu Phe Leu Ala Glu His He 
405 410 415 

ccg aag teg caa tta gaa aaa att gaa tct ccc gaa ggc cac gat gee 1296 
Pro Lys Ser Gin Leu Glu Lys He Glu Ser Pro Glu Gly His Asp Ala 
420 425 ^ 430 

ttc eta ttg gag ttt aag ctg ata aac aaa ctg ata gta caa ttt tta 1344 
Phe Leu Leu Glu Phe Lys Leu He Asn Lys Leu He Val Gin Phe Leu 
435 440 445 

aaa acc aac tgc aag gee att acc gat gee get cca aga get tgg gga 1392 
Lys Thr Asn Cys Lys Ala He Thr Asp Ala Ala Pro Arg Ala Trp Gly 
450 455 460 



t gac gtt ggt aac gat gaa acg aag acg tct gtc ttt ggt gag gee 144 0 
y Asp Val Gly Asn Asp Glu Thr Lys Thr Ser Val Phe Gly Glu Ala 
65 470 475 480 



gaa gaa gtt acc aac tgg tag 1461 
Glu Glu Val Thr Asn Trp 
485 



<210> 32 
<211> 486 
<212> PRT 

<213> Saccharomyces cerevisiae 
<400> 32 

Met Ser His Thr Leu Lys Ser Lys Thr Leu Gin Glu Leu Asp He Glu 
15 10 15 

Glu He Lys Glu Thr Asn Pro Leu Leu Lys Leu Val Gin Gly Gin Arg 
20 25 30 



He Val Gin Val Pro Glu Leu Val Leu Glu Ser Gly Val Val He Asn 
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35 40 45 

Asn Phe Pro lie Ala Tyr Lys Thr Trp Gly Thr Leu Asn Glu Ala Gly 
50 55 60 

Asp Asn Val Leu Val lie Cys His Ala Leu Thr Gly Ser Ala Asp Val 
65 70 75 80 

Ala Asp Trp Trp Gly Pro Leu Leu Gly Asn Asp Leu Ala Phe Asp Pro 
85 90 95 

Ser Arg Phe Phe lie lie Cys Leu Asn Ser Met Gly Ser Pro Tyr Gly 
100 105 110 

Ser Phe Ser Pro Leu Thr He Asn Glu Glu Thr Gly Val Arg Tyr Gly 
115 120 125 

Pro Glu Phe Pro Leu Cys Thr Val Arg Asp Asp Val Arg Ala His Arg 
130 135 140 



t le Val Leu Asp Ser Leu Gly Val Lys Ser He Ala Cys Val He Gly 
5 150 155 160 




Gly Ser Met Gly Gly Met Leu Ser Leu Glu Trp Ala Ala Met Tyr Gly 
165 170 175 

Lys Glu Tyr Val Lys Asn Met Val Ala Leu Ala Thr Ser Ala Arg His 
180 185 190 

Ser Ala Trp Cys He Ser Trp Ser Glu Ala Gin Arg Gin Ser He Tyr 
195 200 205 

Ser Asp Pro Asn Tyr Leu Asp Gly Tyr Tyr Pro Val Glu Glu Gin Pro 
210 215 220 

Val Ala Gly Leu Ser Ala Ala Arg Met Ser Ala Leu Leu Thr Tyr Arg 
225 230 235 240 

Thr Arg Asn Ser Phe Glu Asn Lys Phe Ser Arg Arg Ser Pro Ser He 
245 250 255 

a Gin Gin Gin Lys Ala Gin Arg Glu Glu Thr Arg Lys Pro Ser Thr 
260 265 270 

Val Ser Glu His Ser Leu Gin He His Asn Asp Gly Tyr Lys Thr Lys 
275 280 285 

Ala Ser Thr Ala He Ala Gly He Ser Gly Gin Lys Gly Gin Ser Val 
290 295 300 

Val Ser Thr Ala Ser Ser Ser Asp Ser Leu Asn Ser Ser Thr Ser Met 
305 310 315 320 

Thr Ser Val Ser Ser Val Thr Gly Glu Val Lys Asp He Lys Pro Ala 
325 330 ^ 335 

Gin Thr Tyr Phe Ser Ala Gin Ser Tyr Leu Arg Tyr Gin Gly Thr Lys 
340 345 350 

Phe He Asn Arg Phe Asp Ala Asn Cys Tyr He Ala He Thr Arg Lys 
355 360 365 



Leu Asp Thr His Asp Leu Ala Arg Asp Arg Val Asp Asp He Thr Glu 
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370 375 380 

Val Leu Ser Thr lie Gin Gin Pro Ser Leu lie lie Gly lie Gin Ser 
385 390 395 400 

Asp Gly Leu Phe Thr Tyr Ser Glu Gin Glu Phe Leu Ala Glu His lie 
405 410 415 

Pro Lys Ser Gin Leu Glu Lys lie Glu Ser Pro Glu Gly His Asp Ala 
420 425 430 

Phe Leu Leu Glu Phe Lys Leu lie Asn Lys Leu lie Val Gin Phe Leu 
435 440 445 

Lys Thr Asn Cys Lys Ala lie Thr Asp Ala Ala Pro Arg Ala Trp Gly 
450 455 460 

Gly Asp Val Gly Asn Asp Glu Thr Lys Thr Ser Val Phe Gly Glu Ala 
465 470 475 480 

lu Glu Val Thr Asn Trp 
485 



<210> 33 
<211> 1470 
<212> DNA 

<213> Schizosaccharomyces pombe 

<220> 

<221> CDS 

<222> (1) . . (1467) 

<223> RSO01936 

<400> 33 

atg gaa tct caa tct ccg att gaa tea att gtc ttt act gac tec tgt 48 
Met Glu Ser Gin Ser Pro Tie Glu Ser lie Val Phe Thr Asp Ser Cys 
15 10 15 

cat ccg tct cag caa gaa aat aaa ttt gtt cag ctt att tea gat caa 96 
is Pro Ser Gin Gin Glu Asn Lys Phe Val Gin Leu lie Ser Asp Gin 
20 25 30 

aaa att gca att gtt ccc aaa ttt acg ttg gag tgt ggc gac ate ctt 144 
Lys lie Ala lie Val Pro Lys Phe Thr Leu Glu Cys Gly Asp He Leu 
35 40 45 

tac gat gtt ccc gtt gee ttc aag act tgg ggt act ttg aat aaa gaa 192 
Tyr Asp Val Pro Val Ala Phe Lys Thr Trp Gly Thr Leu Asn Lys Glu 
50 55 ~ 60 

gga aac aat tgt ctt ctt ctt tgt cat get tta agt ggt tct get gat 240 
Gly Asn Asn Cys Leu Leu Leu Cys His Ala Leu Ser Gly Ser Ala Asp 
65 70 75 80 

get gga gat tgg tgg ggt cct tta etc ggt cct ggt cgt gcg ttt gat 288 
Ala Gly Asp Trp Trp Gly Pro Leu Leu Gly Pro Gly Arg Ala Phe Asp 
85 90 95 

cca tea cat ttc ttt ate gta tgc ctt aat tct ctt ggt age cca tac 336 
Pro Ser His Phe Phe He Val Cys Leu Asn Ser Leu Gly Ser Pro Tyr 
100 105 ' 110 
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gga age gec tct cct gtt aca tgg aac get gag act cat agt gtt tat 384 
Gly Ser Ala Ser Pro Val Thr Trp Asn Ala Glu Thr His Ser Val Tyr 
115 120 125 

ggg cca gaa ttt cct tta gca acc ata cgt gat gat gta aac ate cat 432 
Gly Pro Glu Phe Pro Leu Ala Thr lie Arg Asp Asp Val Asn lie His 
130 135 140 

aaa ctt att tta caa aga ttg ggt gta aag caa att get atg gca gta 480 
Lys Leu He Leu Gin Arg Leu Gly Val Lys Gin He Ala Met Ala Val 
145 150 155 160 

ggt ggc tec atg ggt ggt atg ctg gtt ttg gag tgg gca ttt gat aag 528 
Gly Gly Ser Met Gly Gly Met Leu Val Leu Glu Trp Ala Phe Asp Lys 
165 170 175 

gaa ttt gtg cga tea att gtt ccc att tct acc tct ctt cgt cat tec 576 
Glu Phe Val Arg Ser He Val Pro He Ser Thr Ser Leu Arg His Ser 
180 185 190 

eg tgg tgc att age tgg tct gaa gcg caa cgc cag agt ata tat tct 624 
'la Trp Cys He Ser Trp Ser Glu Ala Gin Arg Gin Ser He Tyr Ser 
195 200 205 

gac cct aag ttt aat gat gga tac tac ggc ata gac gat cag cct gta 672 
Asp Pro Lys Phe Asn Asp Gly Tyr Tyr Gly He Asp Asp Gin Pro Val 
210 215 ^ 220 

agt ggc ctt gga get get cgt atg tct gee ttg ttg aca tat cgc tec 72 0 
Ser Gly Leu Gly Ala Ala Arg Met Ser Ala Leu Leu Thr Tyr Arg Ser 
225 230 235 240 

aaa tgt tct ttc gaa cgt cgc ttt gee cgt act gtt cct gat gcg tct 768 
Lys Cys Ser Phe Glu Arg Arg Phe Ala Arg Thr Val Pro Asp Ala Ser 
245 250 255 

cgt cac ccc tat cca gat cgt tta ccc act cct etc acg ccc agt aat 816 
Arg His Pro Tyr Pro Asp Arg Leu Pro Thr Pro Leu Thr Pro Ser Asn 
260 265 270 

ca cat tgg gtc gtt cac aac gaa gga aac cgt aat cgc cgt gaa cga 864 
a His Trp Val Val His Asn Glu Gly Asn Arg Asn Arg Arg Glu Arg 
275 280 285 

cct tgt cga tec aat gga tea tea cct act tct gaa agt get tta aat 912 
Pro Cys Arg Ser Asn Gly Ser Ser Pro Thr Ser Glu Ser Ala Leu Asn 
290 295 300 

tec ccc gee tct tct gtc teg tct tta cct tct tta ggt gec tct cag 960 
Ser Pro Ala Ser Ser Val Ser Ser Leu Pro Ser Leu Gly Ala Ser Gin 
305 310 315 320 



act aca gac agt tct tec ctt aac cag agt teg tta tta aga cgt cct 
Thr Thr Asp Ser Ser Ser Leu Asn Gin Ser Ser Leu Leu Arg Arg Pro 
325 330 335 



aag ttt gta agt cgc ttt gat get aat tgt tac att teg att act aaa 
Lys Phe Val Ser Arg Phe Asp Ala Asn Cys Tyr He Ser He Thr Lys 
355 360 365 



1008 



get aat act tac ttc tct gcg caa teg tat tta cgt tac caa gcg aag 1056 
Ala Asn Thr Tyr Phe Ser Ala Gin Ser Tyr Leu Arg Tyr Gin Ala Lys 
340 345 350 



1104 
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aag ttg gac acc cat gat att act cgt gga cgc ggt tea gac tct cct 1152 
Lys Leu Asp Thr His Asp lie Thr Arg Gly Arg Gly Ser Asp Ser Pro 
370 375 380 

aag gaa gtc atg aag gat ttg tct tta ccc gta etc gta etc ggt att 1200 
Lys Glu Val Met Lys Asp Leu Ser Leu Pro Val Leu Val Leu Gly lie 
385 390 395 400 

gaa age gat ggt ctt ttc aca ttt gac gaa caa gtt gaa att gec aaa 124 8 
Glu Ser Asp Gly Leu Phe Thr Phe Asp Glu Gin Val Glu lie Ala Lys 
405 410 415 

tct ttt ccc aat get acc ttg gaa aaa att att teg gec gaa ggc cac 12 96 
Ser Phe Pro Asn Ala Thr Leu Glu Lys He He Ser Ala Glu Gly His 
420 425 430 

gac ggt ttt ttg ctt gag ttt act caa gta aac tea. cat att caa aaa 1344 
Asp Gly Phe Leu Leu Glu Phe Thr Gin Val Asn Ser His lie Gin Lys 
435 440 445 

tc caa aag gaa cat tta att gat ate atg tct caa act aat tec ttt 13 92 
he Gin Lys Glu His Leu He Asp He Met Ser Gin Thr Asn Ser Phe 
450 455 460 

gag cga ctt gat tec caa gtt aat gat acc aac cgc gaa age gtt ttt 1440 
Glu Arg Leu Asp Ser Gin Val Asn Asp Thr Asn Arg Glu Ser Val Phe 
465 470 475 480 

gga gaa atg gaa gac ata acc tec tgg taa 147 0 

Gly Glu Met Glu Asp He Thr Ser Trp 
485 



<210> 34 

<211> 489 

<212> PRT 

<213> Schizosaccharomyces pombe 



m 



<400> 34 

et Glu Ser Gin Ser Pro He Glu Ser lie Val Phe Thr Asp Ser Cys 
5 10 " 15 



is Pro Ser Gin Gin Glu Asn Lys Phe Val Gin Leu He Ser Asp Gin 
20 25 30 

Lys He Ala He Val Pro Lys Phe Thr Leu Glu Cys Gly Asp He Leu 
35 40 45 

Tyr Asp Val Pro Val Ala Phe Lys Thr Trp Gly Thr Leu Asn Lys Glu 
50 55 60 

Gly Asn Asn Cys Leu Leu Leu Cys His Ala Leu Ser Gly Ser Ala Asp 
65 70 75 "* 80 

Ala Gly Asp Trp Trp Gly Pro Leu Leu Gly Pro Gly Arg Ala Phe Asp 
85 90 * 95 

Pro Ser His Phe Phe He Val Cys Leu Asn Ser Leu Gly Ser Pro Tyr 
100 105 110 

Gly Ser Ala Ser Pro Val Thr Trp Asn Ala Glu Thr His Ser Val Tyr 
115 120 125 
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Gly Pro Glu Phe Pro Leu Ala Thr lie Arg Asp Asp Val Asn lie His 
130 135 140 

Lys Leu lie Leu Gin Arg Leu Gly Val Lys Gin He Ala Met Ala Val 
145 150 155 160 

Gly Gly Ser Met Gly Gly Met Leu Val Leu Glu Trp Ala Phe Asp Lys 
165 170 175 

Glu Phe Val Arg Ser He Val Pro He Ser Thr Ser Leu Arg His Ser 
180 185 190 

Ala Trp Cys He Ser Trp Ser Glu Ala Gin Arg Gin Ser He Tyr Ser 
195 200 205 

Asp Pro Lys Phe Asn Asp Gly Tyr Tyr Gly He Asp Asp Gin Pro Val 
210 215 220 

Ser Gly Leu Gly Ala Ala Arg Met Ser Ala Leu Leu Thr Tyr Arg Ser 
1 25 230 235 240 

iys Cys Ser Phe Glu Arg Arg Phe Ala Arg Thr Val Pro Asp Ala Ser 
245 250 255 

Arg His Pro Tyr Pro Asp Arg Leu Pro Thr Pro Leu Thr Pro Ser Asn 
260 265 270 

Ala His Trp Val Val His Asn Glu Gly Asn Arg Asn Arg Arg Glu Arg 
275 280 285 

Pro Cys Arg Ser Asn Gly Ser Ser Pro Thr Ser Glu Ser Ala Leu Asn 
290 295 300 

Ser Pro Ala Ser Ser Val Ser Ser Leu Pro Ser Leu Gly Ala Ser Gin 
305 310 315 ~ 320 

Thr Thr Asp Ser Ser Ser Leu Asn Gin Ser Ser Leu Leu Arg Arg Pro 
325 330 335 



# 

m Ly 



la Asn Thr Tyr Phe Ser Ala Gin Ser Tyr Leu Arg Tyr Gin Ala Lys 
340 345 350 



.ys Phe Val Ser Arg Phe Asp Ala Asn Cys Tyr He Ser He Thr Lys 
355 360 365 

Lys Leu Asp Thr His Asp He Thr Arg Gly Arg Gly Ser Asp Ser Pro 
370 375 380 

Lys Glu Val Met Lys Asp Leu Ser Leu Pro Val Leu Val Leu Gly He 
385 390 395 400 

Glu Ser Asp Gly Leu Phe Thr Phe Asp Glu Gin Val Glu He Ala Lys 
405 410 415 

Ser Phe Pro Asn Ala Thr Leu Glu Lys He He Ser Ala Glu Gly His 
420 425 430 

Asp Gly Phe Leu Leu Glu Phe Thr Gin Val Asn Ser His He Gin Lys 
435 440 445 

Phe Gin Lys Glu His Leu He Asp He Met Ser Gin Thr Asn Ser Phe 
450 455 460 
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Glu Arg Leu Asp Ser Gin Val Asn Asp Thr Asn Arg Glu Ser Val Phe 
465 470 475 480 

Gly Glu Met Glu Asp lie Thr Ser Trp 
485 





<210> 35 
<211> 1113 
<212> DNA 

<213> Xylella almond 

<220> 

<221> CDS 

<222> (1) . . (1110) 

<223> RXFX01562 

<400> 35 

atg acc gaa ttt ate cct ccg ggc age eta ttc cat gcg etc tec tct 48 

et Thr Glu Phe lie Pro Pro Gly Ser Leu Phe His Ala Leu Ser Ser 
15 10 15 

cca ttt gcg atg aag cgt ggc gga caa etc cac cac gee cgc ate get 96 
Pro Phe Ala Met Lys Arg Gly Gly Gin Leu His His Ala Arg lie Ala 
20 25 30 

tac gaa aca tgg ggc cgc etc aat gee age gee acc aat gee att ctg 144 
Tyr Glu Thr Trp Gly Arg Leu Asn Ala Ser Ala Thr Asn Ala lie Leu 
35 40 45 

ate atg cct ggc tta tea ccc aat gca cat gee gca cac cat gac age 192 
lie Met Pro Gly Leu Ser Pro Asn Ala His Ala Ala His His Asp Ser 
50 55 60 

aat get gag cca ggc tgg tgg gag tea atg eta ggt cca ggc aaa ccc 240 
Asn Ala Glu Pro Gly Trp Trp Glu Ser Met Leu Gly Pro Gly Lys Pro 
65 70 75 80 

ate gac aca gac cgt tgg ttc gtg ate tgt gtc aac tea ctt ggt age 2 88 
le Asp Thr Asp Arg Trp Phe Val He Cys Val Asn Ser Leu Gly Ser 
85 90 95 

tgc aaa gga teg act ggc cct gca teg tac aac ccc ate acg cag gee 3 36 
Cys Lys Gly Ser Thr Gly Pro Ala Ser Tyr Asn Pro He Thr Gin Ala 
100 105 110 

atg tat cgt ttg gac ttt cca gca ctg tea ate gaa gac ggg gee aac 3 84 
Met Tyr Arg Leu Asp Phe Pro Ala Leu Ser He Glu Asp Gly Ala Asn 
115 120 125 

tec gca att gaa gtg gta cat gca ctg ggc ate aag caa ctt gee age 432 
Ser Ala He Glu Val Val His Ala Leu Gly He Lys Gin Leu Ala Ser 
130 135 140 

ctg ate ggc aat tea atg ggc ggc atg acg gca ctg gee ate ctg ctg 480 
Leu He Gly Asn Ser Met Gly Gly Met Thr Ala Leu Ala He Leu Leu 
145 150 155 160 

tta cat cca gat ata gee cgc age cac ate aac ate tea ggc age gcg 528 
Leu His Pro Asp He Ala Arg Ser His He Asn He Ser Gly Ser Ala 
165 170 175 
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cag gca tta ccg ttt tec ate gec att cgc teg eta caa cgc gag gcg 
Gin Ala Leu Pro Phe Ser He Ala He Arg Ser Leu Gin Arg Glu Ala 

180 185 190 

ate cgc ctg gac ccc cat tgg agg cag gga gac tac gac gac acc cac 

He Arg Leu Asp Pro His Trp Arg Gin Gly Asp Tyr Asp Asp Thr His 
195 200 205 

tac ccg gaa teg ggg eta cgc ate gca cgc aaa ctt ggg gtg ate acc 

Tyr Pro Glu Ser Gly Leu Arg He Ala Arg Lys Leu Gly Val He Thr 
210 215 220 

tac cgc tec gcg ctg gaa tgg gac ggg cgt ttt ggc egg gta cgc ttg 

Tyr Arg Ser Ala Leu Glu Trp Asp Gly Arg Phe Gly Arg Val Arg Leu 

225 230 235 240 

gat teg gac caa acc aac gac aca cca ttc gga ctg gaa ttc caa att 

Asp Ser Asp Gin Thr Asn Asp Thr Pro Phe Gly Leu Glu Phe Gin He 

245 250 255 

,aa aac tac ttg gaa age cat gca cac cgc ttc gtg cac acc ttc gac 

au Asn Tyr Leu Glu Ser His Ala His Arg Phe Val His Thr Phe Asp 

260 265 270 

cca aac tgc tac ctg tac ctg age cgc tec atg gac tgg ttc gac gtg 

Pro Asn Cys Tyr Leu Tyr Leu Ser Arg Ser Met Asp Trp Phe Asp Val 
275 280 285 

gee gag tac gee aat gga gac att ctt gee ggg ctg gee agg ate cga 

Ala Glu Tyr Ala Asn Gly Asp He Leu Ala Gly Leu Ala Arg He Arg 
290 295 300 

ate caa cgc gca etc gee ate ggt age cat acc gac ate etc ttt cca 

He Gin Arg Ala Leu Ala He Gly Ser His Thr Asp He Leu Phe Pro 

305 310 315 320 

ata caa cag caa caa caa att gee gaa ggg eta cgc cgt ggc ggt aca 

He Gin Gin Gin Gin Gin He Ala Glu Gly Leu Arg Arg Gly Gly Thr 

325 330 335 

ac gec acc ttc ctg ggc ctt gac tea ccg cag ggg cat gat gcg ttc 

s Ala Thr Phe Leu Gly Leu Asp Ser Pro Gin Gly His Asp Ala Phe 

340 345 350 

ctt gtg gat ate gca aga ttt ggc cct cca gtg aag gaa ttt ctg gac 

Leu Val Asp He Ala Arg Phe Gly Pro Pro Val Lys Glu Phe Leu Asp 
355 360 365 

gaa ctg tga 
Glu Leu 
370 



<210> 36 
<211> 370 
<212> PRT 

<213> Xylella almond 
<400> 36 

Met Thr Glu Phe He Pro Pro Gly Ser Leu Phe His Ala Leu Ser Ser 
15 10 15 

Pro Phe Ala Met Lys Arg Gly Gly Gin Leu His His Ala Arg He Ala 
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576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1113 



MetA 



55 





20 25 30 

Tyr Glu Thr Trp Gly Arg Leu Asn Ala Ser Ala Thr Asn Ala lie Leu 
35 40 45 

lie Met Pro Gly Leu Ser Pro Asn Ala His Ala Ala His His Asp Ser 
50 55 60 

Asn Ala Glu Pro Gly Trp Trp Glu Ser Met Leu Gly Pro Gly Lys Pro 
65 70 75 * 80 

lie Asp Thr Asp Arg Trp Phe Val lie Cys Val Asn Ser Leu Gly Ser 
85 90 95 

Cys Lys Gly Ser Thr Gly Pro Ala Ser Tyr Asn Pro lie Thr Gin Ala 
100 105 110 

Met Tyr Arg Leu Asp Phe Pro Ala Leu Ser He Glu Asp Gly Ala Asn 
115 12 0 125 

er Ala He Glu Val Val His Ala Leu Gly He Lys Gin Leu Ala Ser 
130 135 140 

Leu He Gly Asn Ser Met Gly Gly Met Thr Ala Leu Ala He Leu Leu 
14 5 150 155 160 

Leu His Pro Asp He Ala Arg Ser His He Asn He Ser Gly Ser Ala 
165 170 175 

Gin Ala Leu Pro Phe Ser He Ala He Arg Ser Leu Gin Arg Glu Ala 
180 185 190 

He Arg Leu Asp Pro His Trp Arg Gin Gly Asp Tyr Asp Asp Thr His 
195 2 00 2 05 

Tyr Pro Glu Ser Gly Leu Arg He Ala Arg Lys Leu Gly Val He Thr 
210 215 220 

Tyr Arg Ser Ala Leu Glu Trp Asp Gly Arg Phe Gly Arg Val Arg Leu 
225 230 235 240 

p Ser Asp Gin Thr Asn Asp Thr Pro Phe Gly Leu Glu Phe Gin He 
245 250 255 

Glu Asn Tyr Leu Glu Ser His Ala His Arg Phe Val His Thr Phe Asp 
260 265 270 

Pro Asn Cys Tyr Leu Tyr Leu Ser Arg Ser Met Asp Trp Phe Asp Val 
275 280 285 

Ala Glu Tyr Ala Asn Gly Asp He Leu Ala Gly Leu Ala Arg He Arg 
290 295 300 

He Gin Arg Ala Leu Ala He Gly Ser His Thr Asp He Leu Phe Pro 
305 310 315 * 320 

He Gin Gin Gin Gin Gin lie Ala Glu Gly Leu Arg Arg Gly Gly Thr 
325 330 ~ 335 

His Ala Thr Phe Leu Gly Leu Asp Ser Pro Gin Gly His Asp Ala Phe 
340 345 350 

Leu Val Asp He Ala Arg Phe Gly Pro Pro Val Lys Glu Phe Leu Asp 
M/43127 



355 



360 



365 



Glu Leu 
370 



<210> 37 
<211> 1113 
<212> DNA 

<213> Xylella oleander 

<220> 

<221> CDS 

<222> (1) . . (1110) 

<223> RXFY01729 




<400> 37 

atg acc gaa ttt ate cct ccg ggc age eta ttc cat gcg etc tec tct 48 

Met Thr Glu Phe lie Pro Pro Gly Ser Leu Phe His Ala Leu Ser Ser 
1 5 10 15 

ea ttt gcg atg aag cgt ggc gga caa etc cac cac gec cgc ate get 96 
ro Phe Ala Met Lys Arg Gly Gly Gin Leu His His Ala Arg lie Ala 
20 25 30 

tac gaa aca tgg ggc cgc etc aat gec age gee acc aat gee att ctg 144 
Tyr Glu Thr Trp Gly Arg Leu Asn Ala Ser Ala Thr Asn Ala lie Leu 
35 40 . 45 

ate atg cct ggc tta tea ccc aat gca cat gee gca cac cat gac age 192 
lie Met Pro Gly Leu Ser Pro Asn Ala His Ala Ala His His Asp Ser 
50 55 60 

aat get gag cca ggc tgg tgg gag tea atg eta ggt cca ggc aaa ccc 24 0 
Asn Ala Glu Pro Gly Trp Trp Glu Ser Met Leu Gly Pro Gly Lys Pro 
65 70 75 80 

ate gac aca gac cgt tgg ttc gtg ate tgt gtc aac tea ctt ggt age 2 88 
lie Asp Thr Asp Arg Trp Phe Val lie Cys Val Asn Ser Leu Gly Ser 
85 90 95 



c aaa gga teg act ggc cct gca teg tac aac ccc ate acg cag gee 336 
s Lys Gly Ser Thr Gly Pro Ala Ser Tyr Asn Pro lie Thr Gin Ala 
100 105 110 



atg tat cgt ttg gac ttt cca gca ctg tea ate gaa gac ggg gee aac 3 84 
Met Tyr Arg Leu Asp Phe Pro Ala Leu Ser lie Glu Asp Gly Ala Asn 
115 120 125 

gee gca att gaa gtg gta cat gca ctg ggc ate aag caa ctt gee age 432 
Ala Ala lie Glu Val Val His Ala Leu Gly lie Lys Gin Leu Ala Ser 
130 135 140 

ctg ate ggc aat tea atg ggg ggc atg acg aca ctg gec ate ctg ctg 480 
Leu He Gly Asn Ser Met Gly Gly Met Thr Thr Leu Ala He Leu Leu 
145 150 155 160 

tta cat cca gat att gee cgc age cac ate aac ate tea ggc age gcg 52 8 
Leu His Pro Asp He Ala Arg Ser His He Asn He Ser Gly Ser Ala 
165 170 "* 175 

cag gca tta ccg ttt tec ate gec att cgc teg eta caa cgc gag gcg 576 
Gin Ala Leu Pro Phe Ser He Ala He Arg Ser Leu Gin Arg Glu Ala 
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MetA 





57 

180 185 190 

ate cgc ctg gac ccc cat tgg aag cag gga gac tac gac gac acc cac 624 
lie Arg Leu Asp Pro His Trp Lys Gin Gly Asp Tyr Asp Asp Thr His 
195 200 205 

tac ccg gaa teg ggg eta cgc ate gca cgc aaa etc ggg gtg ate acc 672 
Tyr Pro Glu Ser Gly Leu Arg lie Ala Arg Lys Leu Gly Val He Thr 
210 215 220 

tac cgc tec gcg ctg gaa tgg gac ggg cgt ttt ggc egg gta cgc ttg 72 0 
Tyr Arg Ser Ala Leu Glu Trp Asp Gly Arg Phe Gly Arg Val Arg Leu 
225 230 235 240 

gat teg gac caa acc aac gac aca cca ttc gga ctg gaa ttc caa att 768 
Asp Ser Asp Gin Thr Asn Asp Thr Pro Phe Gly Leu Glu Phe Gin He 
245 250 255 

gaa aac tac ttg gaa age cat gca cac cgc ttc gtg cac acc ttc gac 816 
Glu Asn Tyr Leu Glu Ser His Ala His Arg Phe Val His Thr Phe Asp 
260 265 270 

ca aac tgc tac ctg tac ctg age cgc tec atg gac tgg ttc gac gtg 864 
Pro Asn Cys Tyr Leu Tyr Leu Ser Arg Ser Met Asp Trp Phe Asp Val 
275 280 285 

gee gag tac gee aat gga gac att ctt gee ggg ctg gee agg ate cga 912 
Ala Glu Tyr Ala Asn Gly Asp He Leu Ala Gly Leu Ala Arg He Arg 
290 295 300 



ate caa cgc gca ctt gee ate ggt age cat acc gac ate etc ttt cca 
He Gin Arg Ala Leu Ala He Gly Ser His Thr Asp He Leu Phe Pro 
305 310 315 320 



960 



ata caa cag caa caa caa att gec gaa ggg eta cgc cgt ggc ggt aca 1008 
He Gin Gin Gin Gin Gin He Ala Glu Gly Leu Arg Arg Gly Gly Thr 
325 330 335 



cac gec acc ttc ctg ggc ctt gac tea ccg cag gga cat gat gcg ttc 1056 
His Ala Thr Phe Leu Gly Leu Asp Ser Pro Gin Gly His Asp Ala Phe 
340 345 350 



t gtg gat ate gca gga ttt ggc cct cca gtg aag gaa ttt ctg ggc 1104 
eu Val Asp He Ala Gly Phe Gly Pro Pro Val Lys Glu Phe Leu Gly 
355 360 365 

gaa ctg tga 1113 
Glu Leu 
370 



<210> 38 
<211> 370 
<212> PRT 

<213> Xylella oleander 
<400> 38 

Met Thr Glu Phe He Pro Pro Gly Ser Leu Phe His Ala Leu Ser Ser 
15 10 15 

Pro Phe Ala Met Lys Arg Gly Gly Gin Leu His His Ala Arg He Ala 
20 25 30 
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58 



Tyr Glu Thr Trp Gly Arg Leu Asn Ala Ser Ala Thr Asn Ala lie Leu 
35 40 45 

lie Met Pro Gly Leu Ser Pro Asn Ala His Ala Ala His His Asp Ser 
50 55 60 

Asn Ala Glu Pro Gly Trp Trp Glu Ser Met Leu Gly Pro Gly Lys Pro 
65 70 75 80 

lie Asp Thr Asp Arg Trp Phe Val lie Cys Val Asn Ser Leu Gly Ser 
85 90 95 

Cys Lys Gly Ser Thr Gly Pro Ala Ser Tyr Asn Pro He Thr Gin Ala 
100 105 110 

Met Tyr Arg Leu Asp Phe Pro Ala Leu Ser He Glu Asp Gly Ala Asn 
115 120 125 

Ala Ala He Glu Val Val His Ala Leu Gly He Lys Gin Leu Ala Ser 
130 135 140 

feu He Gly Asn Ser Met Gly Gly Met Thr Thr Leu Ala He Leu Leu 
45 150 155 160 

Leu His Pro Asp He Ala Arg Ser His He Asn He Ser Gly Ser Ala 
165 170 175 

Gin Ala Leu Pro Phe Ser He Ala He Arg Ser Leu Gin Arg Glu Ala 
180 185 190 

He Arg Leu Asp Pro His Trp Lys Gin Gly Asp Tyr Asp Asp Thr His 
195 200 205 

Tyr Pro Glu Ser Gly Leu Arg He Ala Arg Lys Leu Gly Val He Thr 
210 215 220 

Tyr Arg Ser Ala Leu Glu Trp Asp Gly Arg Phe Gly Arg Val Arg Leu 
225 230 235 240 



Asp Ser Asp Gin Thr Asn Asp Thr Pro Phe Gly Leu Glu Phe Gin He 
245 250 255 



u Asn Tyr Leu Glu Ser His Ala His Arg Phe Val His Thr Phe Asp 
260 265 270 

Pro Asn Cys Tyr Leu Tyr Leu Ser Arg Ser Met Asp Trp Phe Asp Val 
275 280 285 

Ala Glu Tyr Ala Asn Gly Asp He Leu Ala Gly Leu Ala Arg He Arg 
290 295 300 

He Gin Arg Ala Leu Ala He Gly Ser His Thr Asp He Leu Phe Pro 
305 310 315 320 

He Gin Gin Gin Gin Gin He Ala Glu Gly Leu Arg Arg Gly Gly Thr 
325 330 335 

His Ala Thr Phe Leu Gly Leu Asp Ser Pro Gin Gly His Asp Ala Phe 
340 345 350 

Leu Val Asp He Ala Gly Phe Gly Pro Pro Val Lys Glu Phe Leu Gly 
355 360 ^ 365 
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Glu Leu 
370 



<210> 39 

<211> 1578 

<212> DNA 

<213> Emericella nidulans 

<220> 

<221> CDS 

<222> (1) . . (1575) 

<223> REN00010 

<400> 39 

at 9 agt ccg ctg aac ggc gtc get cgt tec ttt ccg egg ccc ttc cag 48 

Met Ser Pro Leu Asn Gly Val Ala Arg Ser Phe Pro Arg Pro Phe Gin 

15 10 15 

gec gtg acc agg egg cct ttt cga gtt gtc cag ccg gee ate gee tgt 96 
Via Val Thr Arg Arg Pro Phe Arg Val Val Gin Pro Ala lie Ala Cys 
20 25 30 

ccg tec aac age egg teg ttt aac cat tct cga tea tta cga tea acg 144 
Pro Ser Asn Ser Arg Ser Phe Asn His Ser Arg Ser Leu Arg Ser Thr 
35 40 45 

ggg tct cag tec ccc get cca tec cca cgc gac tec teg aat ccc gcg 192 
Gly Ser Gin Ser Pro Ala Pro Ser Pro Arg Asp Ser Ser Asn Pro Ala 
50 ' 55 60 

ctg tec ttc cct tgc etc gac gec cag gag gee aag tec get ctt ctt 240 
Leu Ser Phe Pro Cys Leu Asp Ala Gin Glu Ala Lys Ser Ala Leu Leu 
65 70 75 80 

tec gcg cga tct ctt ggt tea ggc cct gaa ccc tec tat acc gee ggc 2 88 
Ser Ala Arg Ser Leu Gly Ser Gly Pro Glu Pro Ser Tyr Thr Ala Gly 
85 90 95 



cac cac gaa cga ttc cat tec gac gaa ccg ctg etc ctt gat tgg ggc 336 
is His Glu Arg Phe His Ser Asp Glu Pro Leu Leu Leu Asp Trp Gly 
100 105 110 



ggt ttg ctt cca gaa ttt gat ate gca tat gag aca tgg ggc cag ctg 3 84 

Gly Leu Leu Pro Glu Phe Asp lie Ala Tyr Glu Thr Trp Gly Gin Leu 

115 120 125 

aac gag aag aag gat aat gtc att ctg ctg cat acc ggt ctg tct gca 432 

Asn Glu Lys Lys Asp Asn Val lie Leu Leu His Thr Gly Leu Ser Ala 

130 135 140 

tct age cat gcg cac age acc gaa gcg aac ccg aag ccc ggc tgg tgg 4 80 

Ser Ser His Ala His Ser Thr Glu Ala Asn Pro Lys Pro Gly Trp Trp 

145 150 155 * 160 

gag aaa ttc at a ggt cct ggg aag acg eta gat acg gac aag tac ttt 52 8 

Glu Lys Phe He Gly Pro Gly Lys Thr Leu Asp Thr Asp Lys Tyr Phe 

165 170 175 

gtg ate tgc acc aat gtc ctt gga ggg tgc tac ggt age acg ggg ccc 57 6 

Val He Cys Thr Asn Val Leu Gly Gly Cys Tyr Gly Ser Thr Gly Pro 

180 185 4 190 
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60 



teg 
Ser 


acg 
Thr 


gtg 
Val 
195 


gac 
Asp 


ccg 
Pro 


teg 
Ser 


gat 
Asp 


ggg aag 
Gly Lys 
200 


aag 
Lys 


tat 
Tyr 


get 
Ala 


acg 
Thr 
205 


egg 
Arg 


ttt 
Phe 


ate 
He 


ctg 
Leu 
210 


aca 
Thr 


att 
He 


gaa 
Glu 


gat 
Asp 


atg 
Met 
215 


gtg 
Val 


cga gcg 
Arg Ala 


cag 
Gin 


ttc 
Phe 
220 


cgc 
Arg 


ctt 
Leu 


ttg 
Leu 


cat 
His 
225 


ctt 
Leu 


ggg 

Gly 


gtt 
Val 


egg 
Arg 


aaa 
Lys 
230 


etc 
Leu 


tac gcg 
Tyr Ala 


tec 
Ser 


gtc 
Val 
235 


ggc 

Gly 


tec 
Ser 


age 
Ser 


atg 
Met 


ggt 
Gly 


atg 
Met 


cag 
Gin 


agt 
Ser 


ctt 
Leu 
245 


gca 
Ala 


gee 
Ala 


ggt gtt 
Gly Val 


\* i— y 

Leu 
250 


ttc 
Phe 


cca 
Pro 


gag 
Glu 


cga 
Arg 


gtg 
Val 
255 


aag 
Lys 


att 
He 


gtg 
Val 


teg 
Ser 
260 


att 
He 


age 
Ser 


ggt 
Gly 


tgt 
Cys 


get 
Ala 
265 


cga 
Arg 


age 
Ser 


cat 
His 


ccg 
Pro 


tac 
Tyr 
270 


aqc 
Ser 


M met 

w* 


atg 
Met 


cgc 
Arg 
275 


cat 
His 


ace 
Thr 


cag 
Gin 


egg 
Arg 


cag 
Gin 
280 


gtg 
Val 


ttg 
Leu 


atg 
Met 


atg 
Met 


gat 

Asp 
285 


cca 
Pro 


aat 
Asn 


get 
Ala 


cga 
Arg 
290 


ggt 
Gly 


ttc 
Phe 


tac 
Tyr 


tac 
Tyr 


gat 
Asp 
295 


teg 
Ser 


ate 
He 


cca 
Pro 


cct 
Pro 


cat 
His 
300 


tea 
Ser 


ggc 

Gly 


atg 
Met 



240 




etc get cgc gag att gee ace gtc acg tac cgc age gga cca gaa tgg 
Leu Ala Arg Glu He Ala Thr Val Thr Tyr Arg Ser Gly Pro Glu Trp 
305 310 315 320 

gag aaa cgc ttt ggt egg aaa egg get gat ccg age aaa cag cct gcg 
Glu Lys Arg Phe Gly Arg Lys Arg Ala Asp Pro Ser Lys Gin Pro Ala 
325 330 335 

ctt tgc ccc gac ttt etc ate gag acg tat etc gac cac gee ggt gaa 
Leu Cys Pro Asp Phe Leu He Glu Thr Tyr Leu Asp His Ala Gly Glu 
340 345 350 

aa ttc tgc ttg gaa tac gat gec aac age ctg etc tac ate tec aag 
s Phe Cys Leu Glu Tyr Asp Ala Asn Ser Leu Leu Tyr He Ser Lys 
355 360 365 

gcg atg gat ctg ttt gac eta ggg ttg act cag caa etc gcg acg aag 
Ala Met Asp Leu Phe Asp Leu Gly Leu Thr Gin Gin Leu Ala Thr Lys 
370 375 380 



aag cag agg gcg gag gee cag gcg aag att age age gga aca aac act 
Lys Gin Arg Ala Glu Ala Gin Ala Lys He Ser Ser Gly Thr Asn Thr 
385 390 395 400 

gtc aat gat gcg teg tgc age ctt aca ctt cct gaa cag cca tac cag 
Val Asn Asp Ala Ser Cys Ser Leu Thr Leu Pro Glu Gin Pro Tyr Gin 
405 410 415 

gag cag cca tct gee teg aca tec gec gag cag tct get tec get tea 
Glu Gin Pro Ser Ala Ser Thr Ser Ala Glu Gin Ser Ala Ser Ala Ser 
420 425 430 



gag acc ggg teg get ccg aac gat ctt gtt gee ggg ctt gcg ccg ctg 

Glu Thr Gly Ser Ala Pro Asn Asp Leu Val Ala Gly Leu Ala Pro Leu 
435 440 445 
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624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



MetA 
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61 




aaa 
Lys 


gac 
Asp 
450 


cat 
His 


cag 
Gin 


gtg 
Val 


ctg 
Leu 


gta 
Val 
455 


ate gga gtc 
He Gly Val 


gca 
Ala 


age gac 
Ser Asp 
460 


att 
He 


etc 
Leu 


ttc 
Phe 


ccg 
Pro 
465 


gcg 
Ala 


tgg 
Trp 


caa 
Gin 


cag 
Gin 


cgc 
Arg 
470 


gag 
Glu 


ate 
He 


gcg 
Ala 


gag 
Glu 


act 
Thr 
475 


ctg 
Leu 


att 
He 


caa gca ggg 
Gin Ala Gly 
480 


aac 
Asn 


aag 
Lys 


acc 
Thr 


gtg 
Val 


gag 
Glu 
485 


cat 
His 


att 
He 


gag ctg ggc 
Glu Leu Gly 
490 


aac gac 
Asn Asp 


gtg 
Val 


tct 
Ser 


etc 
Leu 
495 


ttt 
Phe 


ggt 
Gly 


cat 
His 


gac 
Asp 


aca 
Thr 
500 


ttc 
Phe 


etc 
Leu 


ctt 
Leu 


gat gtc 
Asp Val 
505 


aga 
Arg 


acg 
Thr 


teg 
Ser 


gag 
Glu 


gcg 
Ala 
510 


cag 
Gin 


ttc 
Phe 


gca 
Ala 


agt 
Ser 


tec 
Ser 
515 


gta 
Val 


eta 
Leu 


gtc 
Val 


ggc 

Gly 


teg 
Ser 
520 


cac 
His 


ata 
He 


att 

He 


gta 
Val 


caa 
Gin 
525 


tag 






^210> 40 

<211> 525 
<212> PRT 

<213> Emericella nidulans 




















<400> 40 
Met Ser Pro 
1 


Leu 


Asn 
5 


Gly 


Val 


Ala 


Arg 


Ser 
10 


Phe 


Pro 


Arg 


Pro 


Phe 
15 


Gin 


Ala 


Val 


Thr 


Arg 
20 


Arg 


Pro 


Phe 


Arg 


Val 
25 


Val 


Gin 


Pro 


Ala 


He 
30 


Ala 


Cys 


Pro 


Ser 


Asn 
35 


Ser 


Arg 


Ser 


Phe 


Asn 
40 


His 


Ser 


Arg 


Ser 


Leu 
45 


Arg 


Ser 


Thr 


Gly 


Ser 
50 


Gin 


Ser 


Pro 


Ala 


Pro 
55 


Ser 


Pro 


Arg 


Asp 


Ser 
60 


Ser 


Asn 


Pro 


Ala 


JLieu 

r 


Ser 


Phe 


Pro 


Cys 


Leu 
70 


Asp 


Ala 


Gin 


Glu 


Ala 
75 


Lys 


Ser 


Ala 


Leu 


Leu 
80 


"Ser 


Ala 


Arg 


Ser 


Leu 
85 


Gly 


Ser 


Gly Pro Glu 
90 


Pro 


Ser 


Tyr 


Thr Ala Gly 
95 


His 


His 


Glu 


Arg 
100 


Phe 


His 


Ser 


Asp 


Glu 
105 


Pro 


Leu 


Leu 


Leu 


Asp 
110 


Trp 


Gly 


Gly 


Leu 


Leu 
115 


Pro 


Glu 


Phe 


Asp 


He 
120 


Ala 


Tyr 


Glu 


Thr 


Trp 
125 


Gly Gin 


Leu 


Asn 


Glu 
130 


Lys 


Lys 


Asp 


Asn 


Val 
135 


He 


Leu 


Leu 


His 


Thr Gly 
140 


Leu 


Ser 


Ala 


Ser 
145 


Ser 


His 


Ala 


His 


Ser 
150 


Thr 


Glu 


Ala 


Asn 


Pro 
155 


Lys 


Pro 


Gly Trp 


Trp 
160 


Glu 


Lys 


Phe 


He 


Gly 
165 


Pro 


Gly 


Lys 


Thr 


Leu 
170 


Asp 


Thr Asp 


Lys 


Tyr 
175 


Phe 


Val 


He 


Cys 


Thr 
180 


Asn 


Val 


Leu 


Gly Gly Cys 
185 


Tyr Gly Ser 


Thr 
190 


Gly Pro 



1392 



1440 



1488 



1536 



1578 
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62 





Ser Thr Val Asp Pro Ser Asp Gly Lys Lys Tyr Ala Thr Arg Phe Pro 
195 200 205 

lie Leu Thr lie Glu Asp Met Val Arg Ala Gin Phe Arg Leu Leu Asp 
210 215 220 

His Leu Gly Val Arg Lys Leu Tyr Ala Ser Val Gly Ser Ser Met Gly 
225 230 235 240 

Gly Met Gin Ser Leu Ala Ala Gly Val Leu Phe Pro Glu Arg Val Gly 
245 250 255 

Lys lie Val Ser He Ser Gly Cys Ala Arg Ser His Pro Tyr Ser He 
260 265 270 

Ala Met Arg His Thr Gin Arg Gin Val Leu Met Met Asp Pro Asn Trp 
275 280 285 

Ala Arg Gly Phe Tyr Tyr Asp Ser He Pro Pro His Ser Gly Met Lys 
290 295 300 

ieu Ala Arg Glu lie Ala Thr Val Thr Tyr Arg Ser Gly Pro Glu Trp 
305 310 315 320 

Glu Lys Arg Phe Gly Arg Lys Arg Ala Asp Pro Ser Lys Gin Pro Ala 
325 330 335 

Leu Cys Pro Asp Phe Leu He Glu Thr Tyr Leu Asp His Ala Gly Glu 
340 345 350 

Lys Phe Cys Leu Glu Tyr Asp Ala Asn Ser Leu Leu Tyr He Ser Lys 
355 360 365 

Ala Met Asp Leu Phe Asp Leu Gly Leu Thr Gin Gin Leu Ala Thr Lys 
370 375 380 

Lys Gin Arg Ala Glu Ala <31n Ala Lys He Ser Ser Gly Thr Asn Thr 
385 390 395 400 

al Asn Asp Ala Ser Cys Ser Leu Thr Leu Pro Glu Gin Pro Tyr Gin 
405 410 415 

5lu Gin Pro Ser Ala Ser Thr Ser Ala Glu Gin Ser Ala Ser Ala Ser 
420 425 430 

Glu Thr Gly Ser Ala Pro Asn Asp Leu Val Ala Gly Leu Ala Pro Leu 
435 440 445 

Lys Asp His Gin Val Leu Val He Gly Val Ala Ser Asp He Leu Phe 
450 455 460 

Pro Ala Trp Gin Gin Arg Glu He Ala Glu Thr Leu He Gin Ala Gly 
465 470 475 480 

Asn Lys Thr Val Glu His He Glu Leu Gly Asn Asp Val Ser Leu Phe 
485 490 495 

Gly His Asp Thr Phe Leu Leu Asp Val Arg Thr Ser Glu Ala Gin Phe 
500 505 510 

Ala Ser Ser Val Leu Val Gly Ser His He He Val Gin 
515 520 525 
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<210> 41 
<211> 1170 
<212> DNA 

<213> Mesorhizobium loti 



<220> 

<221> CDS 

<222> (1) . . (1167) 

<223> NP 104621 



<400> 41 

atg gcc get ctg cgc gca gga aag acc aac aac gag gec gac cag ccg 48 

Met Ala Ala Leu Arg Ala Gly Lys Thr Asn Asn Glu Ala Asp Gin Pro 
15 10 15 



• 



teg age ccg gtg ttg cgc ttc ggg gcg gac aag ccg etc aag etc gac 96 
Ser Ser Pro Val Leu Arg Phe Gly Ala Asp Lys Pro Leu Lys Leu Asp 
20 25 30 



cc ggc acg ctt ttg teg ccg ttc cag ate gcc tat cag acc tac ggc 144 
la Gly Thr Leu Leu Ser Pro Phe Gin lie Ala Tyr Gin Thr Tyr Gly 
35 40 45 

acg ctg aac gat gcc cgc tec aat gcc ate etc gtc tgc cat gcg ctg 192 
Thr Leu Asn Asp Ala Arg Ser Asn Ala lie Leu Val Cys His Ala Leu 
50 55 60 

acc ggc gac cag cat gtc gcc aac acc aat ccg gtg acc ggc aag ccg 240 
Thr Gly Asp Gin His Val Ala Asn Thr Asn Pro Val Thr Gly Lys Pro 
65 70 75 80 

gga tgg tgg gaa gtg ctg ate ggc ccc ggc agg ate ate gac acc aac 2 88 
Gly Trp Trp Glu Val Leu lie Gly Pro Gly Arg lie lie Asp Thr Asn 
85 90 95 

cgt ttc ttc gtc ate tgc tec aac gtc ate ggc ggt tgt ctg ggc tec 3 36 
Arg Phe Phe Val lie Cys Ser Asn Val lie Gly Gly Cys Leu Gly Ser 
100 105 ~ 110 



c ggc ccg gcc teg acc aac ccc gcc acc ggc aag ccc tac ggg etc 3 84 
r Gly Pro Ala Ser Thr Asn Pro Ala Thr Gly Lys Pro Tyr Gly Leu 
115 120 125 



gac ctg ccg gtc ate acc ate cgc gat atg gtg cgc gcg cag cag atg 43 2 

Asp Leu Pro Val lie Thr He Arg Asp Met Val Arg Ala Gin Gin Met 

130 135 140 

ctg ate gat cat ttc ggc ate gag aaa ctg ttc tgc gtg etc ggc ggc 4 80 

Leu He Asp His Phe Gly lie Glu Lys Leu Phe Cys Val Leu Gly Gly 

145 150 155 160 

teg atg ggc gga atg cag gtg ctg gaa tgg gcg teg age tac ccc gag 52 8 

Ser Met Gly Gly Met Gin Val Leu Glu Trp Ala Ser Ser Tyr Pro Glu 
165 170 175 

cgc gtc ttt teg gca ctg ccg ate gcc acc ggc gcg cgc cat tec teg 576 

Arg Val Phe Ser Ala Leu Pro He Ala Thr Gly Ala Arg His Ser Ser 
180 185 190 

cag aac ate gcc ttc cac gag gtc ggc egg cag get gtc atg gcc gat 624 

Gin Asn He Ala Phe His Glu Val Gly Arg Gin Ala Val Met Ala Asp 
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195 200 205 

ccg gac tgg cac ggc ggc aaa tat ttc gaa aac ggc aaa cgc ccg gaa 672 
Pro Asp Trp His Gly Gly Lys Tyr Phe Glu Asn Gly Lys Arg Pro Glu 
210 215 220 

aag ggc ctg gcg gta gcg cgc atg gcc gcc cac ata acc tat ctg teg 720 
Lys Gly Leu Ala Val Ala Arg Met Ala Ala His lie Thr Tyr Leu Ser 
225 230 235 240 

gaa gcc gcc ctg cac egg aaa ttc ggc cgc aat ctg cag gat cgc gag 768 
Glu Ala Ala Leu His Arg Lys Phe Gly Arg Asn Leu Gin Asp Arg Glu 
245 250 255 

gcg ctg acc ttc ggc ttc gac gcc gac ttc cag ate gaa age tat ctg 816 
Ala Leu Thr -Phe Gly Phe Asp Ala Asp Phe Gin lie Glu Ser Tyr Leu 
260 265 270 

cgc cac caa ggc atg acc ttc gtc gac cgc ttc gac gcc aat tec tat 864 
Arg His Gin Gly Met Thr Phe Val Asp Arg Phe Asp Ala Asn Ser Tyr 
275 280 285 

fctc tac atg acg egg teg atg gac tat ttc gac etc gcc gcc gat cat 912 
Leu Tyr Met Thr Arg Ser Met Asp Tyr Phe Asp Leu Ala Ala Asp His 
290 295 . 300 

ggc ggg egg ctg gcg gat gcc ttt gcc ggc acc aaa acc cgc ttc tgc 960 
Gly Gly Arg Leu Ala Asp Ala Phe Ala Gly Thr Lys Thr Arg Phe Cys 
305 310 315 320 

ctg gtg tec ttc acc teg gat tgg ttg ttt ccg acc gaa gag age cgc 1008 
Leu Val Ser Phe Thr Ser Asp Trp Leu Phe Pro Thr Glu Glu Ser Arg 
325 330 335 

teg ate gtg cac gcg etc aac gcc gcc ggc gcg tec gtg tec ttc gtc 1056 
Ser lie Val His Ala Leu Asn Ala Ala Gly Ala Ser Val Ser Phe Val 
340 345 350 



•i 
1 



gaa ate gag acc gac cgc ggc cac gat gcc ttc ctg etc gac gag ccg 1104 
Glu lie Glu Thr Asp Arg Gly His Asp Ala Phe Leu Leu Asp Glu Pro 
355 360 365 



a ctg ttc gcc gcc ate aac ggc ttc ate ggc tec gcg gcg egg gcg 1152 
lu Leu Phe Ala Ala lie Asn Gly Phe He Gly Ser Ala Ala Arg Ala 
370 375 380 

a g a ggg eta age gca tga 1170 

Arg Gly Leu Ser Ala 

385 



<210> 42 
<211> 389 
<212> PRT 

<213> Mesorhizobium loti 
<400> 42 

Met Ala Ala Leu Arg Ala Gly Lys Thr Asn Asn Glu Ala Asp Gin Pro 
15 10 15 

Ser Ser Pro Val Leu Arg Phe Gly Ala Asp Lys Pro Leu Lys Leu Asp 
20 25 30 
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Ala Gly Thr Leu Leu Ser Pro Phe Gin lie Ala Tyr Gin Thr Tyr Gly 
35 40 45 

Thr Leu Asn Asp Ala Arg Ser Asn Ala lie Leu Val Cys His Ala Leu 
50 55 60 

Thr Gly Asp Gin His Val Ala Asn Thr Asn Pro Val Thr Gly Lys Pro 
65 70 75 80 

Gly Trp Trp Glu Val Leu lie Gly Pro Gly Arg lie lie Asp Thr Asn 
85 90 95 

Arg Phe Phe Val lie Cys Ser Asn Val lie Gly Gly Cys Leu Gly Ser 
100 105 110 

Thr Gly Pro Ala Ser Thr Asn Pro Ala Thr Gly Lys Pro Tyr Gly Leu 
115 120 125 



Asp Leu Pro Val lie Thr lie Arg Asp Met Val Arg Ala Gin Gin Met 
130 135 140 




eu lie Asp His Phe Gly lie Glu Lys Leu Phe Cys Val Leu Gly Gly 
45 150 155 160 

Ser Met Gly Gly Met Gin Val Leu Glu Trp Ala Ser Ser Tyr Pro Glu 
165 170 175 

Arg Val Phe Ser Ala Leu Pro lie Ala Thr Gly Ala Arg His Ser Ser 
180 185 190 

Gin Asn lie Ala Phe His Glu Val Gly Arg Gin Ala Val Met Ala Asp 
195 200 205 

Pro Asp Trp His Gly Gly Lys Tyr Phe Glu Asn Gly Lys Arg Pro Glu 
210 215 220 

Lys Gly Leu Ala Val Ala Arg Met Ala Ala His lie Thr Tyr Leu Ser 
225 230 235 240 

Glu Ala Ala Leu His Arg Lys Phe Gly Arg Asn Leu Gin Asp Arg Glu 
245 250 255 

a Leu Thr Phe Gly Phe Asp Ala Asp Phe Gin lie Glu Ser Tyr Leu 
260 265 270 

Arg His Gin Gly Met Thr Phe Val Asp Arg Phe Asp Ala Asn Ser Tyr 
275 280 285 

Leu Tyr Met Thr Arg Ser Met Asp Tyr Phe Asp Leu Ala Ala Asp His 
290 295 300 

Gly Gly Arg Leu Ala Asp Ala Phe Ala Gly Thr Lys Thr Arg Phe Cys 
305 310 315 320 

Leu Val Ser Phe Thr Ser Asp Trp Leu Phe Pro Thr Glu Glu Ser Arg 
325 330 335 

Ser lie Val His Ala Leu Asn Ala Ala Gly Ala Ser Val Ser Phe Val 
340 345 * 350 

Glu He Glu Thr Asp Arg Gly His Asp Ala Phe Leu Leu Asp Glu Pro 
355 360 365 
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Glu Leu Phe Ala Ala lie Asn Gly Phe lie Gly Ser Ala Ala Arg Ala 
370 375 380 

Arg Gly Leu Ser Ala 
385 



<210> 43 
<211> 1155 
<212> DNA 

<213> acremonium crysogenum 

<220> 

<221> CDS 

<222> (1) . . (1152) 

<223> P39058 

<400> 43 

tgt cgc etc aga teg cca ate get teg agg ctt cgc tag atg ccc aag 48 

Cys Arg Leu Arg Ser Pro lie Ala Ser Arg Leu Arg Xaa Met Pro Lys 

1 5 10 15 




ca tag cca gaa tat cgc tct tea cac tgg aat ctg gcg tea tec ttc 96 
Thr Xaa Pro Glu Tyr Arg Ser Ser His Trp Asn Leu Ala Ser Ser Phe 
20 25 30 

gcg atg tac ccg tgg cat aca aat cgt ggg gtc gca tga atg tct caa 144 
Ala Met Tyr Pro Trp His Thr Asn Arg Gly Val Ala Xaa Met Ser Gin 
35 40 45 

ggg ata act gcg tea teg tct gee aca cct tga cga gca gcg ccc atg 192 
Gly He Thr Ala Ser Ser Ser Ala Thr Pro Xaa Arg Ala Ala Pro Met 
50 55 60 

tea cct cgt ggt ggc cca cac tgt ttg gec aag gca ggg ctt teg ata 240 
Ser Pro Arg Gly Gly Pro His Cys Leu Ala Lys Ala Gly Leu Ser lie 
65 70 75 80 

cct etc get act tea tea tct gee taa att ate teg gga gee cct ttg 288 
Pro Leu Ala Thr Ser Ser Ser Ala Xaa He He Ser Gly Ala Pro Leu 
85 90 95 

a gtg ctg gac cat gtt cac egg acc ccg atg cag aag gee age gee 336 
ly Val Leu Asp His Val His Arg Thr Pro Met Gin Lys Ala Ser Ala 
100 105 110 

cgt acg ggg cca agt ttc etc gca cga cga ttc gag atg atg ttc gta 384 
Arg Thr Gly Pro Ser Phe Leu Ala Arg Arg Phe Glu Met Met Phe Val 
115 120 125 

ttc ate gee agg tgc teg aca ggt tag gcg tea ggc aaa ttg ctg ccg 432 
Phe He Ala Arg Cys Ser Thr Gly Xaa Ala Ser Gly Lys Leu Leu Pro 
130 135 140 

tag teg gcg cat cca tgg gtg gaa tgc aca etc tgg aat ggg cct tct 4 80 
Xaa Ser Ala His Pro Trp Val Glu Cys Thr Leu Trp Asn Gly Pro Ser 
145 150 155 160 

ttg gtc ccg agt acg tgc gaa aga ttg tgc cca teg cga cat cat gee 528 
Leu Val Pro Ser Thr Cys Glu Arg Leu Cys Pro Ser Arg His His Ala 
165 170 " 175 

gtc aga gcg get ggt gcg cag ctt ggt teg aga cac aga ggc agt gca 576 
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Val Arg Ala Ala Gly Ala Gin Leu Gly Ser Arg His Arg Gly Ser Ala 
180 185 190 

tct atg atg acc cca agt acc tgg acg ggg agt acg acg tag acg acc 
Ser Met Met Thr Pro Ser Thr Trp Thr Gly Ser Thr Thr Xaa Thr Thr 
195- 200 205 

age ctg tec ggg ggc teg aaa cag cgc gca aga ttg cga ate tea cgt 
Ser Leu Ser Gly Gly Ser Lys Gin Arg Ala Arg Leu Arg lie Ser Arg 
210 215 220 

aca aga gca aac ctg cga tgg acg age get tec ata tgg etc cag gag 
Thr Arg Ala Asn Leu Arg Trp Thr Ser Ala Ser lie Trp Leu Gin Glu 
225 230 235 240 

tec aag ccg gee gga ata tea gca gee agg atg cga aga agg aaa tea 
Ser Lys Pro Ala Gly lie Ser Ala Ala Arg Met Arg Arg Arg Lys Ser 
245 250 ~ 255 

acg gca cag aca gcg gca aca gee acc gtg ctg gee age cca ttg aag 
"^hr Ala Gin Thr Ala Ala Thr Ala Thr Val Leu Ala Ser Pro Leu Lys 
260 265 270 

ccg tat ctt cct ate tec ggt acc agg ccc aga agt ttg ccg cga get 
Pro Tyr Leu Pro He Ser Gly Thr Arg Pro Arg Ser Leu Pro Arg Ala 
275 280 285 

teg acg cca act get aca teg cca tga cac tea agt teg aca ccc acg 
Ser Thr Pro Thr Ala Thr Ser Pro Xaa His Ser Ser Ser Thr Pro Thr 
290 295 ' 300 

aca tea gca gag gec ggg cag gat caa tec egg agg etc tgg caa tga 
Thr Ser Ala Glu Ala Gly Gin Asp Gin Ser Arg Arg Leu Trp Gin Xaa 
305 310 315 320 

tta cac aac cag cgt tga tea ttt gcg cca ggt cag acg gtc tgt act 
Leu His Asn Gin Arg Xaa Ser Phe Ala Pro Gly Gin Thr Val Cys Thr 
325 330 335 

cgt ttg acg age acg ttg aga tgg ggc gca gta tec caa aca gtc gtc 
Arg Leu Thr Ser Thr Leu Arg Trp Gly Ala Val Ser Gin Thr Val Val 
340 345 350 

t gcg tgg tgg aca cga atg agg gtc atg act tct ttg taa tgg aag 
Phe Ala Trp Trp Thr Arg Met Arg Val Met Thr Ser Leu Xaa Trp Lys 
355 360 365 

egg aca agg tta atg atg ccg tea gag gat tec teg ate agt cat taa 

Arg Thr Arg Leu Met Met Pro Ser Glu Asp Ser Ser He Ser His Xaa 
370 375 380 

tgt 



<210> 44 
<211> 384 
<212> PRT 

<213> acremonium crysogenum 
<220> 

<221> unsure 
<222> 13 ♦ . 13 

<223> All occurrences of Xaa indicate any amino acid 
M/43127 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1155 
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<220> 

<221> unsure 
<222> 18 . . 18 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 45 . . 45 

<223> All occurrences of- Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 59 . , 59 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 89 . . 89 

•<223> All occurrences of Xaa indicate any amino acid 
l220> 
<221> unsure 
<222> 137 . . 137 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 145 . . 145 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 206 . . 206 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 297 . . 297 

<223> All occurrences of Xaa indicate any amino acid 

•|20> 
^21> unsure 
222> 320 . . 320 
<223> All occurrences of Xaa indicate any amino acid 

<220> 

<221> unsure 
<222> 326 . . 326 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 366 . . 366 

<223> All occurrences of Xaa indicate any amino acid 
<220> 

<221> unsure 
<222> 384 . . 384 

<223> All occurrences of Xaa indicate any amino acid 
<400> 44 

Cys Arg Leu Arg Ser Pro lie Ala Ser Arg Leu Arg Xaa Met Pro Lys 
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10 15 



Thr Xaa Pro Glu Tyr Arg Ser Ser His Trp Asn Leu Ala Ser Ser Phe 
20 25 30 

Ala Met Tyr Pro Trp His Thr Asn Arg Gly Val Ala Xaa Met Ser Gin 
35 40 45 

Gly lie Thr Ala Ser Ser Ser Ala Thr Pro Xaa Arg Ala Ala Pro Met 
50 55 60 

Ser Pro Arg Gly Gly Pro His Cys Leu Ala Lys Ala Gly Leu Ser lie 
65 70 75 80 

Pro Leu Ala Thr Ser Ser Ser Ala Xaa lie lie Ser Gly Ala Pro Leu 
85 90 95 

Gly Val Leu Asp His Val His Arg Thr Pro Met Gin Lys Ala Ser Ala 
100 105 110 



g Thr Gly Pro Ser Phe Leu Ala Arg Arg Phe Glu Met Met Phe Val 
115 120 125 




Phe lie Ala Arg Cys Ser Thr Gly Xaa Ala Ser Gly Lys Leu Leu Pro 
130 135 140 

Xaa Ser Ala His Pro Trp Val Glu Cys Thr Leu Trp Asn Gly Pro Ser 
145 150 155 160 

Leu Val Pro Ser Thr Cys Glu Arg Leu Cys Pro Ser Arg His His Ala 
165 170 175 

Val Arg Ala Ala Gly Ala Gin Leu Gly Ser Arg His Arg Gly Ser Ala 
180 185 190 

Ser Met Met Thr Pro Ser Thr Trp Thr Gly Ser Thr Thr Xaa Thr Thr 
195 200 205 

Ser Leu Ser Gly Gly Ser Lys Gin Arg Ala Arg Leu Arg lie Ser Arg 
210 215 220 

r Arg Ala Asn Leu Arg Trp Thr Ser Ala Ser lie Trp Leu Gin Glu 
5 230 235 240 

Ser Lys Pro Ala Gly lie Ser Ala Ala Arg Met Arg Arg Arg Lys Ser 
245 250 255 

Thr Ala Gin Thr Ala Ala Thr Ala Thr Val Leu Ala Ser Pro Leu Lys 
260 265 270 

Pro Tyr Leu Pro lie Ser Gly Thr Arg Pro Arg Ser Leu Pro Arg Ala 
275 280 285 

Ser Thr Pro Thr Ala Thr Ser Pro Xaa His Ser Ser Ser Thr Pro Thr 
290 295 300 

Thr Ser Ala Glu Ala Gly Gin Asp Gin Ser Arg Arg Leu Trp Gin Xaa 
305 310 315 320 

Leu His Asn Gin Arg Xaa Ser Phe Ala Pro Gly Gin Thr Val Cys Thr 
325 330 335 



Arg Leu Thr Ser Thr Leu Arg Trp Gly Ala Val Ser Gin Thr Val Val 
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340 345 350 

Phe Ala Trp Trp Thr Arg Met Arg Val Met Thr Ser Leu Xaa Trp Lys 
355 360 365 

Arg Thr Arg Leu Met Met Pro Ser Glu Asp Ser Ser He Ser His Xaa 
370 375 380 




<210> 45 
<211> 1077 
<212> DNA 

<213> Pseudomonas putida 



<220> 
<221> CDS 
<222> (1) . . (1074) 
223> AAK49778 




400> 45 

atg tea act gtc ttt ccc gaa gat tec gtc ggt ctg gta gta egg caa 48 

Met Ser Thr Val Phe Pro Glu Asp Ser Val Gly Leu Val Val Arg Gin 

1 5 10 15 

acc tec egg ttc gat gaa ccg ctg gca ctg gee tgt ggc cgt tea ctg 96 
Thr Ser Arg Phe Asp Glu Pro Leu Ala Leu Ala Cys Gly Arg Ser Leu 
20 25 " 30 

gee agt tac gaa ctg gtc .tac gag acc tat ggc acc ctg aac gee age 144 
Ala Ser Tyr Glu Leu Val Tyr Glu Thr Tyr Gly Thr Leu Asn Ala Ser 
35 40 45 

gcg age aac gec gtg ctg ate tgc cat gec ctg tec ggc cac cac cat 192 
Ala Ser Asn Ala Val Leu He Cys His Ala Leu Ser Gly His His His 
50 55 60 

gee get ggc tac cat gee gee acc gac cgc aag ccg ggc tgg tgg gac 240 
Ala Ala Gly Tyr His Ala Ala Thr Asp Arg Lys Pro Gly Trp Trp Asp 
* ~ 5 70 75 ' 80 

gc tgc ate ggc ccc gga aaa ccg ate gat acc aac cgc ttc ttc gtg 2 88 
Ser Cys He Gly Pro Gly Lys Pro He Asp Thr Asn Arg Phe Phe Val 
85 90 95 

gtc age ctg aac aac etc ggc ggc tgc aac ggc age acc ggc ccc age 33 6 
Val Ser Leu Asn Asn Leu Gly Gly Cys Asn Gly Ser Thr Gly Pro Ser 
100 105 110 

agt gtc aac cca gee acc ggt aaa ccc tat ggc gee gag ttc ccg gta 3 84 
Ser Val Asn Pro Ala Thr Gly Lys Pro Tyr Gly Ala Glu Phe Pro Val 
115 120 125 

ttg acc gtg gaa gac tgg gtg cac age cag gca egg ctg gee gac cgc 432 
Leu Thr Val Glu Asp Trp Val His Ser Gin Ala Arg Leu Ala Asp Arg 
130 135 140 

ctg ggc ate cag cag tgg gca get ate gtc ggc ggt age ctg ggt ggc 4 80 
Leu Gly He Gin Gin Trp Ala Ala He Val Gly Gly Ser Leu Gly Gly 
145 150 155 160 
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atg cag gcg ctg caa tgg acg atg acc tac ccc gag cgc gta cgc cac 
Met Gin Ala Leu Gin Trp Thr Met Thr Tyr Pro Glu Arg Val Arg His 
165 170 175 

tgc gtc gac att gcc teg gec ccc aag ctg teg gcg cag aac ate gec 
Cys Val Asp He Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala 
180 185 190 

ttc aac gag gtg gcg cgt cag gcc att ctt acc gac cct gag tac cgc 
Phe Asn Glu Val Ala Arg Gin Ala He Leu Thr Asp Pro Glu Tyr Arg 
195 200 205 

aga ggc teg ttt cca gga cca ggt gtg ate ccc aag cgc ggc ctg atg 
Arg Gly Ser Phe Pro Gly Pro Gly Val He Pro Lys Arg Gly Leu Met 
21° 215 220 

ctg gca egg atg gtc ggc cac att acc tat ctg tec gat gat teg atg 
Leu Ala Arg Met Val Gly His He Thr Tyr Leu Ser Asp Asp Ser Met 
225 230 235 240 

rgt gaa aaa ttc ggc cga gag ctg aaa gcg aca age tea act acg act 
ly Glu Lys Phe Gly Arg Glu Leu Lys Ala Thr Ser Ser Thr Thr Thr 
245 250 255 

tec aca gcg teg agt tec agg teg aaa get acc tgc get ate agg gcg 
Ser Thr Ala Ser Ser Ser Arg Ser Lys Ala Thr Cys Ala He Arg Ala 
260 265 270 

agg agt ttt ccg gcc gtt teg acg cca aca cct acc ttg atg acc aag 
Arg Ser Phe Pro Ala Val Ser Thr Pro Thr Pro Thr Leu Met Thr Lys 
275 280 285 

gca ctg gac tat ttc gac ccg gcc gcc acg cac ggt ggt gat ctg gcc 
Ala Leu Asp Tyr Phe Asp Pro Ala Ala Thr His Gly Gly Asp Leu Ala 
290 295 300 

gcc acc ctg gcc cac gtc acg gcg gac tac tgc ate tgt cgt tea cca 
Ala Thr Leu Ala His Val Thr Ala Asp Tyr Cys He Cys Arg Ser Pro 
305 310 315 ~ 320 

I ccg act gcg ctt etc tec ggc ccg ttc gcg cga gat cgt cga cgc get 
^■o Thr Ala Leu Leu Ser Gly Pro Phe Ala Arg Asp Arg Arg Arg Ala 
325 330 ~ 335 

gat ggc cgc gcg caa gaa cgt ctg eta cct gga gat cga ttc gcc eta 
Asp Gly Arg Ala Gin Glu Arg Leu Leu Pro Gly Asp Arg Phe Ala Leu 
340 345 350 

egg gca cga tgc att tec tga 
Arg Ala Arg Cys lie Ser 
355 



<210> 46 
<211> 358 
<212> PET 

<213> Pseudomonas putida 
<400> 46 

Met Ser Thr Val Phe Pro Glu Asp Ser Val Gly Leu Val Val Arg Gin 
1 5 10 1 5 

Thr Ser Arg Phe Asp Glu Pro Leu Ala Leu Ala Cys Gly Arg Ser Leu 
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576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1077 



MetA 



72 



20 

Ala Ser Tyr Glu 
35 

Ala Ser Asn Ala 
50 

Ala Ala Gly Tyr 
65 

Ser Cys lie Gly 



25 



30 





Val Ser Leu Asn 
100 

Ser Val Asn Pro 
115 



eu Thr Val Glu 
130 



Leu Gly lie Gin 
145 

Met Gin Ala Leu 



Cys Val Asp He 
180 

Phe Asn Glu Val 
195 

Arg Gly Ser Phe 
210 

Leu Ala Arg Met 
225 



y Glu Lys Phe 



Ser Thr Ala Ser 
260 

Arg Ser Phe Pro 
275 

Ala Leu Asp Tyr 
290 



Leu Val Tyr Glu Thr Tyr Gly Thr Leu Asn Ala Ser 
40 45 

Val Leu .He Cys His Ala Leu Ser Gly His His His 
55 60 

His Ala Ala Thr Asp Arg Lys Pro Gly Trp Trp Asp 
70 75 ~ 80 

Pro Gly Lys Pro He Asp Thr Asn Arg Phe Phe Val 
85 90 95 

Asn Leu Gly Gly Cys Asn Gly Ser Thr Gly Pro Ser 
105 no 

Ala Thr Gly Lys Pro Tyr Gly Ala Glu Phe Pro Val 
120 125 

Asp Trp Val His Ser Gin Ala Arg Leu Ala Asp Arg 
135 140 

Gin Trp Ala Ala He Val Gly Gly Ser Leu Gly Gly 
150 155 160 

Gin Trp Thr Met Thr Tyr Pro Glu Arg Val Arg His 
165 170 175 

Ala Ser Ala Pro Lys Leu Ser Ala Gin Asn He Ala 
185 190 

Ala Arg Gin Ala He Leu Thr Asp Pro Glu Tyr Arg 
200 205 

Pro Gly Pro Gly Val He Pro Lys Arg Gly Leu Met 
215 220 

Val Gly His He Thr Tyr Leu Ser Asp Asp Ser Met 
230 235 240 

Gly Arg Glu Leu Lys Ala Thr Ser Ser Thr Thr Thr 
245 250 255 

Ser Ser Arg Ser Lys Ala Thr Cys Ala He Arg Ala 
265 270 

Ala Val Ser Thr Pro Thr Pro Thr Leu Met Thr Lys 
280 285 

Phe Asp Pro Ala Ala Thr His Gly Gly Asp Leu Ala 
295 300 



Ala Thr Leu Ala 
305 

Pro Thr Ala Leu 



Asp Gly Arg Ala 
340 

Arg Ala Arg Cys 
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His Val Thr Ala Asp Tyr Cys He Cys Arg Ser Pro 

310 315 " 320 

Leu Ser Gly Pro Phe Ala Arg Asp Arg Arg Arg Ala 

325 330 335 

Gin Glu Arg Leu Leu Pro Gly Asp Arg Phe Ala Leu 

345 350 

He Ser 





355 



<210> 47 
<211> 52 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 47 

cccgggatcc gctagcggcg cgccggccgg cccggtgtga aataccgcac ag 

<210> 48 
<211> 53 
<212> DNA 

<213> Kunstliche Sequenz 
220> 

I223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 48 

tctagactcg agcggccgcg gccggccttt aaattgaaga cgaaagggcc teg 

<210> 49 
<211> 47 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 49 

gagatctaga cccggggatc cgctagcggg ctgetaaagg aagcgga 

<210> 50 
<211> 38 
12> DNA 

13 > Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 50 

gagaggegeg ccgctagcgt gggcgaagaa ctccagca 

<210> 51 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 51 

gagagggegg ccgcgcaaag tcccgcttcg tgaa 
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<210> 52 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 52 

gagagggcgg ccgctcaagt cggtcaagcc acgc 34 

<210> 53 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
400> 53 

Icgaatttaa atctcgagag gcctgacgtc gggcccggta ccacgcgtca tatgactagt 60 
fccggacctag ggatatcgtc gacatcgatg ctcttctgcg ttaattaaca attgggatcc 12 0 
tctagacccg ggatttaaat yay JJJJ 

<210> 54 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 54 

gatcatttaa atcccgggtc tagaggatcc caattgttaa ttaacgcaga agagcatcga 60 
tgtcgacgat atccctaggt ccgaactagt catatgacgc gtggtaccgg gcccgacgtc 12 0 
aggcctctcg agatttaaat 14 0 

<210> 55 
11> 33 
12 > DNA 
r 213> Kunstliche Sequenz 

<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 55 

gagagcggcc gccgatcctt tttaacccat cac 33 

<210> 56 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 56 

aggagcggcc gccatcggca ttttcttttg eg 32 
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<210> 57 
<211> 5091 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz rPlasmid 
<400> 57 



# 




gccgcgactg ccttcgcgaa gccttgcccc gcggaaattt cctccaccga gttcgtgcac SO 

tcttcacaK Ca " 3C " Ctt tcaccctaaa ttcgagagat tggattctS Sgtggaaat 120 

tcttcgcaaa aatcgtcccc tgatcgccct tgcgacgttg gcgtcggtgc cgctoqttac 180 

gcttggcttg accgacttga tcagcggccg c?cgat?tal atctc^gag gcctScgJc III 

ScttSaca ttaa^ 9tCa ta ! 9aCtagt ^cggacctag ggataLgt? gaca^gltg 300 
ctcttctgcg ttaattaaca attgggatcc tctagacccg ggatttaaat cgctagcggg 360 
ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct glccccgS? Ill 
gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgSaaga gaaagcagjt til 
agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaaSga 540 

I«2SSt2 "agctgggg cgccctctgg taaggttggg aagccct^ca aaltaalc^g Too 
UlllZaltl ftgccgccaa ggatctgatg gcgcagggga tcaagatctg atcaagagac 660 
Iflall^ tC9t "^ Ca ^ttgaaca agatggattg cacgcaggtt ctccggccgc 720 
bSKSS a " C ^ a " C9 9 c t^tgactg ggcacaacag acaatcggct gctc?|atgc 780 
2E2£££ C39Ct3t ° ag C9Ca 3999 c 9 cccggttctt tttgtcaaga ccgacctgic 840 
tStf.°tt 9 aat9aact 9° ^ggacgaggc agcgcggcta tcgtggctgg ccacgacggg 900 
cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaajggacl ggctgcta?? 960 
SSXS? CC99ggCa " atctcctgtc atctcacctt gctclfgccg fjaaagtatc 1020 
catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccaftcga 1080 
ta JZtrj aaaCatCgca ^gagcgagc acgtactcgg atggaagccg gtcttgtcga llll 
toaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccLgct 1200 
caaggcgcgc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cctgctScc 1260 
gaatatcatg gtggaaaatg gccgcttttc tggattcatc gac?gt|gc? ggc?ggg? g ? llll 
ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctglag Sct?Sc£ HH 
cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcl? 1440 
cgccttcttg acgagttctt ctgagcggga Itctggggtt cgaaatgacc 1500 
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctafgaa 1560 
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcgggXt 1620 
ctcatgctgg agttcttcgc ccacgctagc ggcgcgccgg c?ggcccggt gtgaaSacc Isll 
gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga 1740 
2 g cgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa agcggtaat llol 

Iacggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa alggccagca 1860 
fcaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tc?gccc?cc 
■acgagcat cacaaaaabc gacgctcaag tcagaggtgg cgaaacccga caggactata llll 
lagataccag gcgtttcccc ctggaagctc cctcgtgcgc t?tcctgt?c cgKcctgcc loll 

Icoctotaoo ^ 9tC ^ CCtttctccc ttcgggaagc gtggcgcttt c?catagctc 2100 
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 2160 
accccccgtt cagcccgacc gctgcgcctt atccggtaac ta?cgfc?tg Ig?ccaaccc till 
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgaj till 
"^f V* agttctt 9 aa 9tggtggcct aactacggct Lacta^ llll 
^ a9ta " t 99 tatct 9^ ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 2400 
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagcl till 
S^ aC9 ^ 9C agaaaaaaa9 3atctcaaga agatcctttg atcttttcta cggggtcLJ 2520 
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat calllaggat 2580 
cttcacctag atccttttaa aggccggccg cggccgcgca aagtcccgct tcgtgaSat till 
tttcgtgccg cgtgattttc cgccaaaaac tttaacgaac gttcgttata atggStcat 2 700 
gaccttcacg acgaagtact aaaattggcc cgaatcatca gcta?ggatc tc?SgatS till 
cgcgcbggag tccgacgcgc tcgatgctgc cgtcgattta aaaacigtga tcgga?t£?t till 
ccgagctctc gatacgacgg acgcgccagc atcacgagac tgggccag?g ccgcgaqcaa till 
accaS aaCt CtC9t "° g9 *tcttgagga gctggctgac gagctgc^tg ctcg^cagc till 
gccaggagga cgcacagtag tggaggatgc aatcagttgc gcctactgcg gtggcctXt 3000 
tcctccccgg cctgaoccgc gaggacggcg cgcaaaatat tgctcagatg Igtgtcglgc loll 
cgcagccagc cgcgagcgcg ccaacaaacg ccacgccgag gagctggagg cLctagqtc 3120 
gcaaatggcg ctggaagtgc gtcccccgag cgaaatt^ gccatStcg tScaglJct llll 
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ggaagcggca gcgagaatta tcgcgatcgt 
aaatgccgcg tttcgtgtgc cgtggccgcc 
ccgaatcggc agcagcgtcg cgcgtcgaaa 
gcacgaatac ctgaaaaatg ttgaacgccc 
acccccagtc caaacctggg agaaagcgct 
ttgacacacc ggcctggaaa ttttccgctg 
tgcgatcacg tggctggacg agcgaagacc 
aaaatttcca gggcagcaag acccgcgact 
cggagaaaca cagccgaagt tataccgagt 
tgttgctctg acgcacgcgc agcacgcagc 
ccaccaggcc ggcgggaaaa tcgagcacgt 
ctgggcacgc ctggaaaaag cgccagcttg 
ccagctcatc tggctcattg atccggtgta 
gcgcctgctg gctgcaacga ccgaggaaat 
ttcacatagg ctgagccgtg gccactgcac 
tgcccagcac aatcgcgtgg atcgcctagc 
aggcacagaa aaacctaaaa aacgctatga 
cgaagcggca agaaaagcca ctgcggaagc 
gccgagcgcc gctgaagcgt ctggagagct 

Itccagggcgt gccgcccgtg atgagacggc 
|ttaaaagcg gctggtgagc gcctaaaaga 
■tacaccgtc gctcaggcgg tcggaggagg 
Ecgccagacg gattggccgc gacgtgtgcg 
ccctgctcgt cagacagaga cgcagagcca 
aagacgtggc ggtaaaaagg ccgcagaacg 
agcacagcga gaaaaactag ctaagtccag 
tcgcttgacc attgcaggtt ggtttatgac 
aatcaatgaa gctatgtctg aatttagcgt 
ggtctgcggg cattgaactt ccacgaggac 
cgtaggcaga aaacggttcc cccgtagggt 
tgattgctct tgaagctctc taggggggct 
gctcgcctcg taagcgcaca aggactgctc 



ggcggtgccc gcaggcatga caaacatcgt 3240 
caggacgtgt cagcgccgcc accacctgca 3300 
aagcgcacag gcggcaagaa gcgataagct 3360 
cgtgagcggt aactcacagg gcgtcggcta 342 0 
caaaaatgac tctagcggat tcacgagaca 3480 
atctgttcga cacccatccc gagctcgcgc 3540 
gccgcgaatt cctcgctcac ctgggcagag 3600 
tcgccagcgc ttggatcaaa gacccggaca 3 660 
tggttcaaaa tcgcttgccc ggtgccagta 3 720 
cgtgcttgtc ctggacattg atgtgccgag 3780 
aaaccccgag gtctacgcga ttttggagcg 3840 
gatcggcgtg aatccactga gcgggaaatg 3 900 
tgccgcagca ggcatgagca gcccgaatat 3960 
gacccgcgtt ttcggcgctg accaggcttt 4 02 0 
tctccgacga tcccagccgt accgctggca 4 080 
tgatcttatg gaggttgctc gcatgatctc 414 0 
gcaggagttt tctagcggac gggcacgtat 42 00 
aaaagcactt gccacgcttg aagcaagcct 42 60 
gatcgacggc gtccgtgtcc tctggactgc 4320 
ttttcgccac gctttgactg tgggatacca 43 80 
caccaagggt catcgagcct acgagcgtgc 444 0 
ccgtgagcct gatctgccgc cggactgtga 4 500 
cggctacgtc gctaaaggcc agccagtcgt 4560 
gccgaggcga aaagctctgg ccactatggg 4620 
ctggaaagac ccaaacagtg agtacgcccg 4680 
tcaacgacaa gctaggaaag ctaaaggaaa 4740 
tgttgaggga gagactggct cgtggccgac 4 800 
gtcacgtcag accgtgaata gagcacttaa 4860 
gccgaaagct tcccagtaaa tgtgccatct 492 0 
ctctctcttg gcctcctttc taggtcgggc 4980 
cacaccatag gcagataacg ttccccaccg 5040 
ccaaagatct tcaaagccac t 5091 



<210> 58 
<211> 4323 
<212> DNA 

<213> Kunstliche Sequenz 

I<220> 
■23> Beschreibung der kunst lichen Sequenz : Plasmid 
KoO> 58 

tctctcagcg tatggttgtc gcctgagctg tagttgcctt catcgatgaa ctgctgtaca 60 
ttttgatacg tttttccgtc accgtcaaag attgatttat aatcctctac accgttgatg 120 
ttcaaagagc tgtctgatgc tgatacgtta acttgtgcag ttgtcagtgt ttgtttgccg 180 
taatgtttac cggagaaatc agtgtagaat aaacggattt ttccgtcaga tgtaaatgtg 240 
gctgaacctg accattcttg tgtttggtct tttaggatag aatcatttgc atcgaatttg 3 00 
tcgctgtctt taaagacgcg gccagcgttt ttccagctgt caatagaagt ttcgccgact 360 
ttttgataga acatgtaaat cgatgtgtca tccgcatttt taggatctcc ggctaatgca 420 
aagacgatgt ggtagccgtg at'agtttgcg acagtgccgt cagcgttttg taatggccag 480 
ctgtcccaaa cgtccaggcc ttttgcagaa gagatatttt taattgtgga cgaatcaaat 54 0 
tcagaaactt gatatttttc atttttttgc tgttcaggga tttgcagcat atcatggcgt 600 
gtaatatggg aaatgccgta tgtttcctta tatggctttt ggttcgtttc tttcgcaaac 660 
gcttgagttg cgcctcctgc cagcagtgcg gtagtaaagg ttaatactgt tgcttgtttt 72 0 
gcaaactttt tgatgttcat cgttcatgtc tcctttttta tgtactgtgt tagcggtctg 780 
cttcttccag ccctcctgtt tgaagatggc aagttagtta cgcacaataa aaaaagacct 840 
aaaatatgta aggggtgacg ccaaagtata cactttgccc tttacacatt ttaggtcttg 900 
cctgctttat cagtaacaaa cccgcgcgat ttacttttcg acctcattct attagactct 960 
cgtttggatt gcaactggtc tattttcctc ttttgtttga tagaaaatca taaaaggatt 102 0 
tgcagactac gggcctaaag aactaaaaaa tctatctgtt tcttttcatt ctctgtattt 1080 
tttatagttt ctgttgcatg ggcataaagt tgccttttta atcacaattc agaaaatatc 1140 
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«c9 3 *g g =c ItlllllSt !";" 9t9a '"WMt. ta t9C9 ,t 9 g 9ttBaaag9 1200 

S& 2 55= 5= 53ES3 5=352 SS 

sis Isi ill ps ssi ssi s 

SS Si Ep SiS SSi iSHS E 
ill! EE S3 SSS SS E 

S«ro4. S2S£ SS3SS 2~» JSJ 

fc ° gtC ^ 9ac c ^tggcgat gcctgcttgc cgaaSatca? ggtggaaSt 22s2 

•2 s ~ ess; H b? 

feSSS SSSSE KS££ SSSE S 

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgS? ttSaaatco 

C9CC99Ct ^ ^gatcctcc agcgcgggga tc?catg??g gag??cttco a"S 
cccacgctag cggcgcgccg gccggcccgg tgtgaaatac cgcacagatg cSaaaaaof 2?!! 
aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgc?gcg cJcJSca?? lllc, 
cggctgcggc gagcggtatc agctcactca aaggcggta! tacggttftc caclgaatca leti 
lllltZst SSSS tS?S? 9Ca a r" CCagC aaaa ^ccag g a : a ?gta a : 2 2 8 8 8 0 ° 

SEES -™ 23= aa ~: SSSS ;s: 

SSK2 S22E 25SK 25SS SsS 

£S£2? tC9CtC caa9ct ^gc tgtgtgclcg aaccccccgf. ?cagcccglc 3180 

355 F? 5 == «= ssa 

=bS S« £SF ~ ™K 22 
sssss sS £ s=s= »" 

^yuuctcig ggactxtggt catgagatta tcaaaaagga tcttcaccta aatcrht-f-h a unn 

5-SSS 55=22 £322 22222 

^?? aa f!J 9 9Cgcaaac 9 fc tgattgtttg tctgcgtaga atccictgtt fgtXtataa 37^ 

In S F™ *~ =as ~3 

ccg??aatc? SatSS- agaaacataa «aagcatgt aaatatcgtt agacgiaatS 3960 
tta"*"S Jcatttttga tccgcgggag tcagtgaaca ggtaccattt gccgStcatt 4020 
atc a c?tt?t TclalT t° aat " Catct Sttactgtgt tagatgcaat cagcggtttc tola 
aactcagccg tgclttt?^ SSSSS" agCtcaatCa taccgagagc gccg?? t gct 4140 
gatgtgctt? tgccataata £252?° agaa9ttttt 3actttcttg acggaagaat 4200 
tcagt?ccaQ trttJSSS tgctttgtta aataaagatt cttcgccttg gtagccatct 4260 
tcagttccag tgtttgcttc aaatactaag tatttgtggc ctttatcttc tacgtagtga 4320 
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